KR102503904B1 - 파라메트릭 오디오 디코딩 - Google Patents
파라메트릭 오디오 디코딩 Download PDFInfo
- Publication number
- KR102503904B1 KR102503904B1 KR1020197009987A KR20197009987A KR102503904B1 KR 102503904 B1 KR102503904 B1 KR 102503904B1 KR 1020197009987 A KR1020197009987 A KR 1020197009987A KR 20197009987 A KR20197009987 A KR 20197009987A KR 102503904 B1 KR102503904 B1 KR 102503904B1
- Authority
- KR
- South Korea
- Prior art keywords
- frequency
- value
- stereo parameter
- output signal
- signal
- Prior art date
Links
- 230000001143 conditioned effect Effects 0.000 claims abstract description 77
- 230000003750 conditioning effect Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims description 52
- 230000001419 dependent effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 35
- 230000005236 sound signal Effects 0.000 description 33
- 230000004044 response Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000010363 phase shift Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
Abstract
스테레오 파라미터 컨디셔너는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성한다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 2 값은 제 2 주파수 범위와 연관된다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다.
Description
우선권 주장
본 출원은 공동 소유의, 발명의 명칭이 "PARAMETRIC AUDIO DECODING" 인 2016 년 10월 13일자로 출원된 미국 가특허 출원 제 62/407,843 호 및 발명의 명칭이 "PARAMETRIC AUDIO DECODING" 인 2017년 9월 19일자로 출원된 미국 정규특허 출원 제 15/708,717 호로부터 우선권의 이익을 주장하고, 전술된 출원들 각각의 내용들은 그 전체가 참조로서 본원에 명확하게 포함된다.
기술분야
본 개시물은 일반적으로 파라메트릭 오디오 디코딩에 관한 것이다.
기술에서의 진보들은 더 작고 더 강력한 컴퓨팅 디바이스들을 초래하였다. 예를 들어, 작고, 경량의, 그리고 사용자들에 의해 쉽게 운반되는 모바일 및 스마트 폰들과 같은 무선 전화기들, 태블릿들 및 랩톱 컴퓨터들을 포함하는 다양한 휴대용 개인 컴퓨팅 디바이스들이 현재 존재한다. 이들 디바이스들은 무선 네트워크들을 통해 음성 및 데이터 패킷들을 통신할 수 있다. 또한, 많은 이러한 디바이스들은 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 레코더, 및 오디오 파일 플레이어와 같은 부가적인 기능성을 통합한다. 또한, 이러한 디바이스들은, 인터넷에 액세스하는데 사용될 수 있는 웹 브라우저 애플리케이션과 같은 소프트웨어 애플리케이션들을 포함하는, 실행가능 명령들을 프로세싱할 수 있다. 이와 같이, 이들 디바이스들은 중요한 컴퓨팅 능력들을 포함할 수 있다.
컴퓨팅 디바이스는 오디오 신호들을 수신하도록 다수의 마이크로폰들을 포함할 수도 있다. 스테레오 오디오가 레코딩되는 경우, 컴퓨팅 디바이스의 인코더는 오디오 신호들에 기초하여 스테레오 파라미터들을 생성할 수도 있다. 인코더는 오디오 신호들 및 스테레오 파라미터의 값들을 인코딩하는 비트스트림을 생성할 수도 있다. 컴퓨팅 디바이스는 다른 컴퓨팅 디바이스들로 비트스트림을 송신할 수도 있다.
컴퓨팅 디바이스는 비트스트림을 수신 및 디코딩하여 그 비트스트림에 기초하여 출력 신호들을 생성할 수도 있다. 디코더는 스테레오 파라미터들의 값들에 기초하여 디코딩된 오디오를 조정함으로써 출력 신호들을 생성할 수도 있다. 소정 환경들에서, 스테레오 파라미터들의 값들을 사용하여 디코딩된 오디오를 조정하는 것은 오디오 신호를 정확히 재생성하지 않을 수도 있다. 예를 들어, 출력 신호는 스테레오 파라미터들의 값들을 디코딩된 오디오 신호에 적용하는 것에서 비롯되는 사운드 아티팩트들을 포함할 수도 있다.
본원에 개시된 기법들의 일 구현에 따르면, 장치는 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하도록 구성된 수신기를 포함한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낸다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값은 제 2 주파수 범위와 연관되고, 제 2 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 장치는 또한, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하도록 구성된 중간 신호 디코더를 포함한다. 장치는 또한, 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하도록 구성된 변환 유닛을 포함한다.
장치는 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하도록 구성된 스테레오 디코더를 더 포함한다. 장치는 또한, 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하도록 구성된 스테레오 파라미터 컨디셔너를 포함한다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다. 장치는 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하도록 구성된 업-믹서를 더 포함한다. 컨디셔닝된 값은 업-믹스 동작 동안 주파수-도메인 디코딩된 중간 신호에 적용된다. 장치는 또한, 제 1 출력 신호 및 제 2 출력 신호를 출력하도록 구성된 출력 디바이스를 포함한다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초하고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초한다.
본원에 개시된 기법들의 다른 구현에 따르면, 방법은, 디코더에서, 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하는 단계를 포함한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낸다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값은 제 2 주파수 범위와 연관되고, 제 2 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 방법은 또한, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하는 단계를 포함한다. 방법은 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하는 단계를 더 포함한다.
방법은 또한, 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하는 단계를 포함한다. 방법은 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하는 단계를 더 포함한다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다. 방법은 또한, 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 단계를 포함한다. 컨디셔닝된 값은 업-믹스 동작 동안 주파수-도메인 디코딩된 중간 신호에 적용된다. 방법은 또한, 제 1 출력 신호 및 제 2 출력 신호를 출력하는 단계를 포함한다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초하고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초한다.
본원에 개시된 기법들의 다른 구현에 따르면, 컴퓨터 판독가능 저장 디바이스는, 디코더 내의 프로세서에 의해 실행되는 경우, 프로세서로 하여금 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낸다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값은 제 2 주파수 범위와 연관되고, 제 2 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 동작들은 또한, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하는 것을 포함한다.
동작들은 또한, 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하는 것을 포함한다. 동작들은 또한, 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하는 것을 포함한다. 동작들은 또한, 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하는 것을 포함한다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다.
동작들은 또한, 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 것을 포함한다. 컨디셔닝된 값은 업-믹스 동작 동안 주파수-도메인 디코딩된 중간 신호에 적용된다. 동작들은 또한, 제 1 출력 신호 및 제 2 출력 신호를 출력하는 것을 포함한다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초하고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초한다.
본원에 개시된 기법들의 다른 구현에 따르면, 장치는 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하기 위한 수단을 포함한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낸다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값은 제 2 주파수 범위와 연관되고 인코더-측 윈도윙 스킴을 사용하여 결정된다. 장치는 또한, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하기 위한 수단을 포함한다.
장치는 또한, 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하기 위한 수단을 포함한다. 장치는 또한, 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하기 위한 수단을 포함한다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다.
장치는 또한, 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하기 위한 수단을 포함한다. 컨디셔닝된 값은 업-믹스 동작 동안 주파수-도메인 디코딩된 중간 신호에 적용된다. 장치는 또한, 제 1 출력 신호 및 제 2 출력 신호를 출력하기 위한 수단을 포함한다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초하고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초한다.
도 1 은 파라메트릭 오디오 디코딩을 수행하도록 동작 가능한 디바이스를 포함하는 시스템의 특정 예시적 예의 블록도이고;
도 2 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 예를 예시하는 다이어그램이고;
도 3 은 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 4 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 5 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 6 은 도 1 의 시스템의 디코더의 예를 예시하는 다이어그램이고;
도 7 은 파라메트릭 오디오 디코딩의 특정 방법을 예시하는 플로우차트이고;
도 8 은 도 1 내지 도 7 에 대하여 설명된 기법들을 수행하도록 동작 가능한 디바이스의 특정 예시적 예의 블록도이며;
도 9 는 도 1 내지 도 8 에 대하여 설명된 기법들을 수행하도록 동작 가능한 기지국의 특정 예시적 예의 블록도이다.
도 2 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 예를 예시하는 다이어그램이고;
도 3 은 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 4 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 5 는 도 1 의 시스템에 의해 생성된 파라미터 값들의 다른 예를 예시하는 다이어그램이고;
도 6 은 도 1 의 시스템의 디코더의 예를 예시하는 다이어그램이고;
도 7 은 파라메트릭 오디오 디코딩의 특정 방법을 예시하는 플로우차트이고;
도 8 은 도 1 내지 도 7 에 대하여 설명된 기법들을 수행하도록 동작 가능한 디바이스의 특정 예시적 예의 블록도이며;
도 9 는 도 1 내지 도 8 에 대하여 설명된 기법들을 수행하도록 동작 가능한 기지국의 특정 예시적 예의 블록도이다.
파라메트릭 오디오 인코딩 및 디코딩을 수행하도록 동작 가능한 시스템들 및 디바이스들이 개시된다. 일부 구현들에서, 인코더/디코더 윈도윙은 본원에서 추가로 설명된 바와 같이, 멀티채널 신호 코딩에 대해 불일치되어 디코딩 지연을 감소시킬 수도 있다.
디바이스는 다수의 오디오 신호들을 인코딩하도록 구성된 인코더, 다수의 오디오 신호들을 디코딩하도록 구성된 디코더, 또는 양자 모두를 포함할 수도 있다. 다수의 오디오 신호들은 다수의 레코딩 디바이스들, 예를 들어 다수의 마이크로폰들을 사용하여 시간적으로 동시에 캡처될 수도 있다. 일부 예들에서, 다수의 오디오 신호들 (또는 멀티-채널 오디오) 은 동시에 또는 상이한 시간들에 레코딩되는 여러 오디오 채널들을 멀티플렉싱함으로써 합성적으로 (예를 들어, 인공적으로) 생성될 수도 있다. 예시적인 예들에서, 오디오 채널들의 공존하는 레코딩 또는 멀티플렉싱은 2-채널 구성 (즉, 스테레오: 좌측 및 우측), 5.1 채널 구성 (좌측, 우측, 센터, 좌측 서라운드, 우측 서라운드, 및 저 주파수 강조 (LFE) 채널들), 7.1 채널 구성, 7.1+4 채널 구성, 22.2 채널 구성, 또는 N-채널 구성을 초래할 수도 있다.
일부 시스템들에서, 인코더 및 디코더는 쌍으로서 동작할 수도 있다. 인코더는 오디오 신호를 인코딩하도록 하나 이상의 동작들을 수행할 수도 있고 디코더는 디코딩된 오디오 출력을 생성하도록 하나 이상의 동작들을 (상반된 순서로) 수행할 수도 있다. 예시하기 위해, 인코더 및 디코더 각각은 변환 동작 (예를 들어, 이산 푸리에 변환 (DFT 동작) 및 역 변환 동작 (예를 들어, 역 이산 푸리에 변환 (IDFT) 동작) 을 수행하도록 구성될 수도 있다. 예를 들어, 인코더는 오디오 신호를 시간 도메인으로부터 변환 도메인으로 변환하여 DFT 대역들과 같은 변환 도메인 주파수 대역들에서 하나 이상의 파라미터들 (예를 들어, 인터 채널 스테레오 파라미터들) 의 값들을 추정할 수도 있다. 인코더는 또한, 추정된 하나 이상의 파라미터들에 기초하여 하나 이상의 오디오 신호들을 파형 코딩할 수도 있다. 다른 예로서, 디코더는 하나 이상의 수신된 파라미터들을 수신된 오디오 신호에 적용하기 전에 수신된 오디오 신호를 시간 도메인으로부터 변환 도메인으로 변환할 수도 있다.
각각의 변환 동작 전에 그리고 각각의 역 변환 동작에 후속하여, 신호 (예를 들어, 오디오 신호) 는 "윈도윙되어" 윈도윙된 샘플들을 생성한다. 윈도윙된 샘플들은 변환 동작을 수행하는데 사용되고 윈도윙된 샘플들을 역 변환 동작 후에 오버랩 추가된다. 본원에 사용된 바와 같이, 윈도우를 신호에 적용하는 것 또는 신호를 윈도윙하는 것은 신호의 샘플들의 시간-범위를 생성하도록 신호의 일부를 스케일링하는 것을 포함한다. 그 일부를 스케일링하는 것은 신호의 일부에 윈도우의 형상에 대응하는 값들을 곱하는 것을 포함할 수도 있다.
일부 구현들에서, 인코더 및 디코더는 상이한 윈도윙 스킴들을 구현할 수도 있다. 예를 들어, 인코더는 제 1 세트의 특징들 (예를 들어, 제 1 세트의 파라미터들) 을 갖는 제 1 윈도우를 적용할 수도 있고, 디코더는 제 2 세트의 특징들 (예를 들어, 제 2 세트의 파라미터들) 을 갖는 제 2 윈도우를 적용할 수도 있다. 제 1 세트의 특징들 중 하나 이상의 특징들을 제 2 세트의 특징들과 상이할 수도 있다. 예를 들어, 제 1 세트의 특징들은 윈도우의 오버랩핑 부분 사이즈 또는 윈도우 오버랩핑 부분 형상의 관점들에서 제 2 세트의 특징들과 상이할 수도 있다. 예시하기 위해, 제 1 윈도우 및 제 2 윈도우가 불일치되는 경우 (예를 들어, 디코더의 제 2 윈도우의 미리보기 부분이 인코더의 제 1 윈도우의 미리보기 부분보다 더 짧은 경우), 인코더 및 디코더 프로세싱 및 오버랩-추가 윈도우들이 밀접하게 일치하고 샘플들의 동일한 시간-범위에 대응하는 샘플들에 적용되는 시스템과 비교하여 지연이 감소될 수도 있다.
인코더에 의해 사용된 윈도우 및 디코더에 의해 사용된 윈도우가 불일치되는 경우, 인코더에 의해 제공된 스테레오 파라미터들의 값들을 사용하는 것은 디코더에서 더 낮은 오디오 품질을 초래할 수도 있다. 예를 들어, 제 2 주파수 범위에 대응하는 스테레오 파라미터의 제 2 값에 대한 제 1 주파수 범위에 대응하는 스테레오 파라미터의 제 1 값의 변동은 인코더에서 프로세싱 및 오버랩-추가 윈도우가 디코더에서 사용된 것과는 상이한 (예를 들어, 상이한 사이즈를 갖는) 경우 가청 아티팩트들을 초래할 수도 있다.
인코더는 주파수 범위를 다수의 주파수 빈들로 분할할 수도 있다. 주파수 빈들의 그룹은 단일의 주파수 대역 (또는 범위) 로서 취급될 수도 있다. 예를 들어, 제 1 주파수 범위 (예를 들어, 제 1 주파수 대역) 는 주파수 빈들의 세트를 포함할 수도 있다. 인코더는 제 1 레졸루션에서 스테레오 파라미터들의 값들을 결정할 수도 있다. 예를 들어, 인코더는 주파수 대역 (또는 범위) 당 스테레오 파라미터의 값을 결정할 수도 있다. 디코더는 제 1 레졸루션보다 더 조악한 (또는 더 미세-그레이닝된) 제 2 레졸루션에서 스테레오 파라미터들의 값들을 적용할 수도 있다. 예를 들어, 디코더는 제 1 주파수 범위에 대응하는 스테레오 파라미터의 제 1 값 (예를 들어, 제 1 대역 값) 을 주파수 빈들의 세트의 각각의 주파수 빈에 적용할 수도 있다. 대역에서 대역으로 스테레오 파라미터의 값에서의 상당한 변동을 갖는, 특히 더 낮은 주파수들 (예를 들어, 1 kHz 미만) 에서, (더 적은 주파수 빈들을 갖는) 더 짧은 대역들은 아티팩트들을 초래할 수도 있다. 예를 들어, 스테레오 업믹싱 동안 스테레오 파라미터의 값들의 적용은 더 짧은 오버랩 윈도우들에 대응하는 열악한 통과대역-저지대역 거부로 인해 주파수 빈들 간에 스펙트럼 누설 아티팩트들을 도입할 수도 있다.
디코더는 아티팩트들을 감소시키기 위해 제 1 값들 (예를 들어, 대역 값들) 상에서 컨디셔닝 동작을 수행함으로써 스테레오 파라미터의 제 2 값들을 생성할 수도 있다. 본원에 사용된 바와 같이 "컨디셔닝 동작" 은 제한 동작, 평활화 동작, 조정 동작, 보간 동작, 외삽 동작, 스테레오 파라미터의 상이한 값들을 대역들에 걸쳐 일정한 값으로 설정하는 것, 스테레오 파라미터의 상이한 값들을 프레임들에 걸쳐 일정한 값으로 설정하는 것, 스테레오 파라미터의 상이한 값들을 0 (또는 상대적으로 작은 값) 으로 설정하는 것, 또는 이들의 조합을 포함할 수도 있다. 디코더는 적어도 하나의 빈에 적용된 스테레오 파라미터의 값을 대역 값으로부터 그 대역 값과 인접한 대역 값 간의 빈 값으로 변경할 수도 있다. 예시하기 위해, 디코더는, 비트스트림이 제 1 주파수 범위 (예를 들어, 200 헤르츠 (Hz) 내지 400 Hz) 에 대응하는 스테레오 파라미터의 제 1 대역 값 (예를 들어, -10 데시벨 (dB)) 을 나타낸다고 결정할 수도 있다. 디코더는, 비트스트림이 제 2 주파수 범위 (예를 들어, 400 Hz 내지 600 Hz) 에 대응하는 스테레오 파라미터의 제 2 대역 값 (예를 들어, 5 dB) 을 나타낸다고 결정할 수도 있다. 제 1 주파수 범위는 제 1 주파수 빈 (예를 들어, 200 Hz 내지 300 Hz) 및 제 2 주파수 빈 (예를 들어, 300 Hz 내지 400 Hz) 을 포함할 수도 있다. 디코더는 제 1 대역 값 및 제 2 대역 값 (예를 들어, 5 dB) 에 기초하여 제 2 주파수 빈에 적용된 값을 제 1 대역 값 (예를 들어, -10 dB) 으로부터 수정된 제 1 빈 값 (예를 들어, -5 dB) 으로 변경 (또는 컨디셔닝) 할 수도 있다. 예를 들어, 디코더는, 제 1 대역 값 및 제 2 대역 값에 추정 함수를 적용함으로써 제 1 빈 값을 결정할 수도 있다. 다른 예에서, 디코더는 제 1 주파수 범위로부터 제 2 주파수 범위로의 파라미터 변동의 정도에 기초하여, 제 1 대역, 제 2 대역, 또는 양자 모두 내의 선택된 주파수 빈들에 대응하는 스테레오 파라미터의 값들을 컨디셔닝할 수도 있다. 예를 들어, 디코더는 제 1 대역 값과 제 2 대역 값 간의 차이에 기초하여, 제 1 대역의 특정 주파수 빈들, 제 2 대역의 특정 주파수 빈들, 또는 양자 모두에 대응하는 스테레오 파라미터의 값들을 컨디셔닝할 수도 있다. 다른 구현에서, 디코더는 또한, 제 1 대역에서의 특정 주파수 빈 값 및 이전 프레임의 제 2 대역에서의 특정 주파수 빈 값에 기초하여 스테레오 파라미터의 값을 컨디셔닝할 수도 있다.
유사하게, 제 2 주파수 범위 (예를 들어, 400 Hz 내지 600 Hz) 는 제 1 특정 주파수 빈 (예를 들어, 400 Hz 내지 500 Hz) 및 제 2 특정 주파수 빈 (예를 들어, 500 Hz 내지 600 Hz) 을 포함할 수도 있다. 디코더는 제 1 대역 값 (예를 들어, -10 dB) 및 제 2 대역 값에 기초하여 제 1 특정 주파수 빈에 적용된 값을 제 2 대역 값 (예를 들어, 5 dB) 으로부터 제 2 빈 값 (예를 들어, 0 dB) 로 변경 (또는 컨디셔닝) 할 수도 있다.
디코더는 스테레오 파라미터들의 제 2 값들에 적어도 부분적으로 기초하여 제 1 출력 신호 및 제 2 출력 신호를 생성할 수도 있다. 연속적인 주파수 범위들에 대응하는 제 2 값들 간의 차이들은 (제 1 값들과 비교하여) 더 낮을 수도 있고 따라서 덜 지각 가능하다. 예를 들어, 제 1 빈 값 (예를 들어, -5 dB) 과 제 2 빈 값 (예를 들어, 0 dB) 간의 차이는 제 1 대역 값 (예를 들어, -10 dB) 내지 제 2 대역 값 (예를 들어, 5 dB) 간의 차이와 비교하여, 제 1 주파수 범위 및 제 2 주파수 범위의 경계 (예를 들어, 400 Hz) 에서 덜 지각 가능할 수도 있다. 디코더는 제 1 출력 신호를 제 1 스피커에 그리고 제 2 출력 신호를 제 2 스피커에 제공할 수도 있다.
본원에 지칭된 바와 같이, "생성하는", "계산하는", "사용하는", "선택하는", "액세스하는" 및 "결정하는" 은 상호 교환적으로 사용될 수도 있다. 예를 들어, 파라미터 (또는 신호) 를 "생성하는", "계산하는" 또는 "결정하는" 것은 파라미터 (또는 신호) 를 능동적으로 생성하는 것, 계산하는 것, 또는 결정하는 것을 지칭할 수도 있고 또는 다른 컴포넌트 또는 디바이스에 의한 것과 같이 이미 생성되는 파라미터 (또는 신호) 를 사용하는 것, 선택하는 것, 또는 액세스하는 것을 지칭할 수도 있다.
도 1 을 참조하면, 시스템의 특정 예시적 예가 개시되고 일반적으로 100 으로 지정된다. 시스템 (100) 은 네트워크 (120) 를 통해 제 2 디바이스 (106) 에 통신 가능하게 커플링된 제 1 디바이스 (104) 를 포함한다. 네트워크 (120) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다.
제 1 디바이스 (104) 는 인코더 (114), 송신기 (110), 하나 이상의 입력 인터페이스들 (112), 또는 이들의 조합을 포함한다. 입력 인터페이스(들) (112) 의 제 1 입력 인터페이스는 제 1 마이크로폰 (146) 에 커플링된다. 입력 인터페이스들 (112) 의 제 2 입력 인터페이스는 제 2 마이크로폰 (148) 에 커플링된다. 인코더 (114) 는 본원에 설명된 바와 같이, 다수의 오디오 신호들 및 스테레오 파라미터 값들을 다운믹스 및 인코딩하도록 구성된다.
동작 동안, 제 1 디바이스 (104) 는 제 1 마이크로폰 (146) 으로부터 제 1 입력 인터페이스를 통해 제 1 오디오 신호 (130) 를 수신할 수도 있고 제 2 마이크로폰 (148) 으로부터 제 2 입력 인터페이스를 통해 제 2 오디오 신호 (132) 를 수신할 수도 있다. 제 1 오디오 신호 (130) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (132) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다.
인코더 (114) 는 (제 1 윈도우 파라미터들에 기초한) 제 1 윈도우를 오디오 신호의 적어도 일부에 적용하여 윈도윙된 샘플들을 생성할 수도 있다. 윈도윙된 샘플들은 시간-도메인으로 생성될 수도 있다. 인코더 (114)(예를 들어, 주파수-도메인 스테레오 코더) 는 하나 이상의 시간-도메인 신호들, 예컨대 윈도윙된 샘플들 (예를 들어, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 을 주파수-도메인 신호들로 변환할 수도 있다. 주파수-도메인 신호들은 스테레오 파라미터들의 값들을 추정하는데 사용될 수도 있다. 예를 들어, 인코더 (114) 는 스테레오 파라미터의 스테레오 파라미터 값들 (151, 155) 을 추정하고 스테레오 파라미터 값들 (151, 155) 을 인코딩된 스테레오 파라미터 정보 (158) 로서 인코딩할 수도 있다. 스테레오 파라미터는 좌측 채널들 및 우측 채널들과 연관된 공간적 특성들의 렌더링을 가능하게 할 수도 있다. 하나의 스테레오 파라미터에 대응하는 스테레오 파라미터 값들 (151, 155) 의 추정이 설명되지만, 인코더 (114) 는 다수의 스테레오 파라미터들에 대응하는 스테레오 파라미터 값들을 결정할 수도 있다는 것이 이해되어야 한다. 예를 들어, 인코더 (114) 는 제 1 스테레오 파라미터에 대응하는 제 1 스테레오 파라미터 값들, 제 2 스테레오 파라미터에 대응하는 제 2 스테레오 파라미터 값들, 등을 결정할 수도 있다. 일부 구현들에 따라, 스테레오 파라미터는 인터채널 세기 차이 (IID) 파라미터들, 예시적, 비제한적 예들로서 인터채널 레벨 차이 (ILD)들 파라미터들, 인터채널 시간 차이 (ITD) 파라미터들, 인터채널 위상 차이 (IPD) 파라미터들, 인터채널 상관 (ICC) 파라미터들, 비-캐주얼 시프트 파라미터들, 스펙트럼 틸트 파라미터들, 인터-채널 유성 파라미터들, 인터-채널 피치 파라미터들, 인터-채널 이득 파라미터들, 등을 포함한다.
스테레오 파라미터 값들 (151, 155) 은 제 1 주파수 범위 (152)(예를 들어, 200 Hz 내지 400 Hz) 에 대응하는 제 1 파라미터 값 (151) 및 제 2 주파수 범위 (156)(예를 들어, 400 Hz 내지 800 Hz) 에 대응하는 제 2 파라미터 값 (155) 을 포함한다. 특정 양태에서, 제 1 주파수 범위 (152) 는 복수의 주파수 빈들을 포함하는 주파수 대역에 대응할 수도 있다. 각각의 주파수 빈은 주파수 범위의 특정 레졸루션 또는 길이 (예를 들어, 50 Hz 또는 40 Hz) 에 대응할 수도 있다. 특정 양태에서, 주파수 범위는 불-균일하게 사이징된 주파수 빈들을 포함할 수도 있다. 예를 들어, 주파수 범위의 제 1 주파수 빈은 주파수 범위의 제 2 주파수 빈의 제 2 길이와 별개인 제 1 길이를 가질 수도 있다. 주파수 범위 (예를 들어, 400 Hz 내지 600 Hz) 의 길이 (예를 들어, 200 Hz) 는 주파수 범위 (예를 들어, 600 Hz - 400 Hz) 에서 최고 주파수 값과 최저 주파수 값 간의 차이에 대응할 수도 있다. 주파수 빈의 길이는 주파수 빈을 포함하는 주파수 범위의 사이즈보다 작거나 동일할 수도 있다. 주파수 빈 및 주파수 범위 구조는 인간의 청각 음향 심리학에 기초할 수도 있어서, 각각의 주파수 빈 및 주파수 범위는 가변하는 주파수 레졸루션들에 대응한다. 통상적으로, 더 낮은 주파수 대역들은 더 높은 주파수 대역들보다 더 높은 레졸루션들을 초래한다.
특정 양태에서, 인코더 (114) 는 제 1 주파수 범위 (152) 의 주파수 빈들 각각에 대응하는 파라미터 값 (예를 들어, IPD 값, ILD 값, 또는 이득 값) 을 결정할 수도 있다. 예시하기 위해, 인코더 (114) 는 제 1 주파수 범위 (152) 의 하나 이상의 주파수 빈들의 파라미터 값들에 기초하여 제 1 파라미터 값 (151) 을 결정할 수도 있다. 예를 들어, 제 1 파라미터 값 (151) 은 하나 이상의 주파수 빈들의 파라미터 값들의 가중화된 평균에 대응할 수도 있다. 인코더 (114) 는 유사하게, 제 2 주파수 범위 (156) 의 하나 이상의 주파수 빈들의 파라미터 값들에 기초하여 제 2 파라미터 값 (155) 을 결정할 수도 있다. 제 1 주파수 범위 (152) 는 제 2 주파수 범위 (156) 와 동일한 사이즈 또는 상이한 사이즈를 가질 수도 있다. 예를 들어, 제 1 주파수 범위 (152) 는 제 1 수의 주파수 빈들을 포함할 수도 있고 제 2 주파수 범위 (156) 는 제 1 수와 동일한, 또는 이와는 다른 제 2 수의 주파수 빈들을 포함할 수도 있다.
인코더 (114) 는 중간 신호를 인코딩하여 인코딩된 중간 신호 (102) 를 생성한다. 인코더 (114) 는 사이드 신호를 인코딩하여 인코딩된 사이드 신호 (103) 를 생성한다. 예시의 목적을 위해, 다르게 언급되지 않는다면, 제 1 오디오 신호 (130) 는 좌측-채널 신호 (l 또는 L) 이고 제 2 오디오 신호 (132) 는 우측-채널 신호 (r 또는 R) 인 것으로 가정된다. 제 1 오디오 신호 (130) 의 주파수-도메인 표현은 Lfr(b) 로서 표기될 수도 있고 제 2 오디오 신호 (132) 의 주파수-도메인 표현은 Rfr(b) 로서 표기될 수도 있고, 여기서 b 는 주파수-도메인 표현들의 대역을 나타낸다. 일 구현에 따르면, 사이드 신호 (예를 들어, 사이드대역 신호 Sfr(b)) 는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 의 주파수-도메인 표현들로부터 주파수-도메인에서 생성될 수도 있다. 예를 들어, 사이드 신호 (103)(예를 들어, 사이드-대역 신호 Sfr(b)) 는 (Lfr(b)-Rfr(b))/2 로서 표현될 수도 있다. 사이드 신호 (예를 들어, 사이드-대역 신호 Sfr(b)) 는 사이드-대역 인코더에 제공되어 사이드-대역 비트스트림을 생성할 수도 있다. 일 구현에 따르면, 중간 신호 (예를 들어, 중간-대역 신호 m(t)) 는 시간-도메인에서 생성되고 주파수-도메인으로 변환될 수도 있다. 예를 들어, 중간 신호 (예를 들어, 중간-대역 신호 m(t)) 는 (l(t)+r(t))/2 로서 표현될 수도 있다. 시간-도메인/주파수-도메인 중간-대역 신호들 (예를 들어, 중간 신호) 은 중간-대역 인코더에 제공되어 인코딩된 중간 신호 (102) 를 생성할 수도 있다.
사이드-대역 신호 (Sfr(b)) 및 중간-대역 신호 (m(t) 또는 Mfr(b)) 는 다수의 기법들을 사용하여 인코딩될 수도 있다. 일 구현에 따르면, 시간-도메인 중간-대역 신호 (m(t)) 는 더 높은 대역 코딩을 위한 대역폭 확장을 갖는 대수 코드-여기 선형 예측 (ACELP) 과 같은 시간-도메인 기법을 사용하여 인코딩될 수도 있다. 사이드-대역 코딩 전에, (코딩되거나 코딩되지 않은) 중간-대역 신호 (m(t)) 는 주파수-도메인 (예를 들어, 변환-도메인) 으로 컨버팅되어 중간-대역 신호 (Mfr(b)) 를 생성할 수도 있다. 비트스트림 (101) 은 인코딩된 중간 신호 (102), 인코딩된 사이드 신호 (103), 및 인코딩된 스테레오 파라미터 정보 (158) 를 포함한다. 송신기 (110) 는 네트워크 (120) 를 통해, 비트스트림 (101) 을 제 2 디바이스 (106) 로 송신한다.
제 2 디바이스 (106) 는 수신기 (111) 및 메모리 (153) 에 커플링된 디코더 (118) 를 포함한다. 디코더 (118) 는 중간 신호 디코더 (604), 변환 유닛 (606), 업-믹서 (610), 사이드 신호 디코더 (612), 변환 유닛 (614), 스테레오 디코더 (616), 스테레오 파라미터 컨디셔너 (618), 역 변환 유닛 (622), 및 역 변환 유닛 (624) 을 포함한다. 디코더 (118) 는 적어도 하나의 컨디셔닝된 파라미터 값에 기초하여 다수의 채널들을 업-믹스 및 렌더링하도록 구성된다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 또는 양자 모두에 커플링될 수도 있다. 제 2 디바이스 (106) 는 또한, 분석 데이터를 저장하도록 구성된 메모리 (153) 를 포함할 수도 있다.
제 2 디바이스 (106) 의 수신기 (111) 는 비트스트림 (101) 을 수신할 수도 있다. 중긴 신호 디코더는 인코딩된 중간 신호 (102) 를 디코딩하여 디코딩된 중간 신호, 예컨대 도 6 의 디코딩된 중간 신호 (630)(예를 들어, 중간-대역 신호 (mCODED(t))) 를 생성하도록 구성된다. 변환 유닛 (606) 은 디코딩된 중간 신호 상에서 변환 동작을 수행하여 주파수-도메인 디코딩된 중간 신호, 예컨대 도 6 의 주파수-도메인 디코딩된 중간 신호 (MCODED(b)) (632) 를 생성하도록 구성된다. 변환 유닛 (606) 은 제 2 윈도우들 (예를 들어, 제 2 윈도우 파라미터들에 기초한 분석 윈도우) 을 디코딩된 중간 신호에 적용하여 윈도윙된 샘플들을 생성할 수도 있다. 윈도윙된 샘플들은 시간-도메인으로 생성될 수도 있다. 사이드 신호 디코더 (612) 는 인코딩된 사이드 신호 (103) 를 디코딩하여 디코딩된 사이드 신호, 예컨대 도 6 의 디코딩된 사이드 신호 (634) 를 생성하도록 구성된다. 변환 유닛 (614) 은 디코딩된 사이드 신호 상에서 변환 동작을 수행하여 주파수-도메인 디코딩된 사이드 신호, 예컨대 도 6 의 주파수-도메인 디코딩된 사이드 신호 (636) 를 생성하도록 구성된다. 변환 유닛 (614) 은 제 2 윈도우들 (예를 들어, 제 2 윈도우 파라미터들에 기초한 분석 윈도우) 을 디코딩된 사이드 신호에 적용하여 윈도윙된 샘플들을 생성할 수도 있다. 윈도윙된 샘플들은 시간-도메인으로 생성될 수도 있다.
스테레오 파라미터 디코더 (616) 는 인코딩된 스테레오 파라미터 정보 (158) 를 디코딩하여 스테레오 파라미터의 제 1 값 (151), 스테레오 파라미터의 제 2 값 (155), 및 추가적인 스테레오 파라미터 값들 (158) 을 결정하도록 구성된다. 제 1 값 (151) 은 제 1 주파수 범위 (152) 와 연관되고, 제 1 값 (151) 은 제 1 오버랩 사이즈를 갖는 제 1 윈도우들을 사용하는 인코더 (114) 의 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값 (155) 은 제 2 주파수 범위 (156) 와 연관되고, 제 2 값 (155) 은 인코더-측 윈도윙 스킴을 사용하여 또한 결정된다. 부가적으로, 스테레오 디코더 (638) 는 인코딩된 스테레오 파라미터 정보 (158) 를 디코딩하는 것에 응답하여 비트스트림 (101) 으로 인코딩된 각각의 스테레오 파라미터에 대한 추가적인 스테레오 파라미터 값들을 결정할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 제 1 값 (151) 및 제 2 값 (155) 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값 (640) 을 생성하도록 구성된다. 컨디셔닝된 값 (640) 은 제 1 주파수 범위 (152) 의 서브세트 또는 제 2 주파수 범위 (156) 의 서브세트인 특정 주파수 범위 (170) 와 연관될 수도 있다. 비-제한적 예로서, 스테레오 파라미터 컨디셔너 (618) 는 제 1 값 (151) 및 제 2 값 (155) 에 추정 함수를 적용할 수도 있다. 추정 함수는 평균 함수, 조정 함수, 또는 커브-피팅 함수를 포함할 수도 있다. 다른 구현들에서, 스테레오 파라미터 컨디셔너 (618) 는 값들 (151, 155) 상에서 다른 컨디셔닝 동작들을 수행하여 컨디셔닝된 값 (640) 을 생성하도록 구성될 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 제한 동작, 평활화 동작, 조정 동작, 보간 동작, 외삽 동작, 값들 (151, 155) 을 대역들에 걸쳐 일정한 값으로 설정하는 것을 포함하는 동작, 값들 (151, 155) 을 프레임들에 걸쳐 일정한 값으로 설정하는 것을 포함하는 동작, 값들 (151, 155) 을 0 (또는 상대적으로 작은 값) 으로 설정하는 것을 포함하는 동작, 또는 이들의 조합을 수행할 수도 있다. 특정 주파수 범위 (170) 가 제 1 주파수 범위 (152) 의 서브세트이면, 컨디셔닝된 값 (640) 은 제 1 값 (151) 과는 별개이다. 특정 주파수 범위 (170) 가 제 2 주파수 범위 (156) 의 서브세트이면, 컨디셔닝된 값 (640) 은 제 2 값 (155) 과는 별개이다. 스테레오 파라미터 컨디셔너 (618) 는 또한, 컨디셔닝 동작에 기초하여 스테레오 파라미터의 하나 이상의 추가적인 컨디션 값들 (미도시) 을 생성하도록 구성될 수도 있다. 하나 이상의 추가적인 컨디션 값들의 각각의 컨디션 값은 제 1 주파수 범위 (152) 의 서브세트 또는 제 2 주파수 범위 (156) 의 서브세트인 대응하는 주파수 범위와 연관된다.
스테레오 파라미터 컨디셔너 (618) 는, 추정 함수가 오버랩 윈도우 사이즈, 코딩 비트레이트, 하나 이상의 스테레오 파라미터들의 값들의 변동, 또는 이들의 조합에 기초하여 적용될지 여부를 결정할 수도 있다. 예를 들어, 비트스트림 (101) 은 하나 이상의 스테레오 파라미터들의 스테레오 파라미터 값들을 나타낼 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 오버랩 윈도우 사이즈가 임계 윈도우 사이즈를 충족시키지 못한다는 것 (예를 들어, 임계 윈도우 사이즈 미만), 코딩 비트레이트가 임계 코딩 비트레이트를 충족시킨다는 것 (예를 들어, 임계 코딩 비트레이트 이상), 스테레오 파라미터의 값들의 변동이 변동 임계를 충족시킨다는 것, 또는 이들의 조합을 결정하는 것에 응답하여 추정 함수가 하나 이상의 스테레오 파라미터들의 서브세트의 스테레오 파라미터 값들에 적용된다고 결정할 수도 있다. 특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 다양한 파라미터들에 기초하여 추정 함수와 연관된 하나 이상의 임계들을 결정할 수도 있다. 하나 이상의 임계들은 임계 윈도우 사이즈, 임계 코딩 비트레이트, 변동 임계, 또는 이들의 조합을 포함할 수도 있다. 다양한 파라미터들은 코딩 비트레이트, DFT 윈도우 특징들, 스테레오 파라미터 값들, 근본적인 중간 신호 특징들, 또는 이들의 조합을 포함할 수도 있다.
특정 양태에서, 제 1 스테레오 파라미터의 스테레오 파라미터 값들 (158) 에 적용된 추정 함수는 제 2 스테레오 파라미터의 제 2 스테레오 파라미터 값들에 기초할 수도 있다. 예를 들어, 비트스트림 (101) 은 제 1 스테레오 파라미터 (예를 들어, ILD) 의 스테레오 파라미터 값들 (158), 제 2 스테레오 파라미터 (예를 들어, IPD) 의 특정 파라미터 값들, 또는 이들의 조합을 포함할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 추정 함수가 스테레오 파라미터 값들 (158), 제 2 스테레오 파라미터의 특정 파라미터 값들, 또는 이들의 조합에 기초하여 스테레오 파라미터 값들 (158) 에 적용될지 여부를 결정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 의 제 1 변동, 특정 파라미터 값들의 제 2 변동, 또는 양자 모두를 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 제 1 변동이 제 1 변동 임계 (예를 들어, 중간 변동 임계) 를 충족시킨다 (예를 들어, 제 1 변동 임계보다 크다) 는 것 및 제 2 변동이 변동 임계 (예를 들어, 중간 변동 임계) 를 충족시킨다 (예를 들어, 변동 임계보다 크다) 는 결정에 응답하여, 추정 함수가 스테레오 파라미터 값들 (158), 특정 파라미터 값들, 또는 이들의 조합에 적용된다는 것을 결정할 수도 있다. 특정 구현에서, 스테레오 파라미터 컨디셔너 (618) 는, 제 1 변동이 제 1 변동 임계 (예를 들어, 매우 낮은 변동 임계) 를 충족시킨다는 것 (예를 들어, 제 1 변동 임계 미만) 및 제 2 변동이 제 2 변동 임계 (예를 들어, 중간 변동 임계) 를 충족시킨다 (예를 들어, 변동 임계보다 크다) 는 결정에 응답하여, 추정 함수가 제 1 스테레오 파라미터 (예를 들어, ILD) 의 스테레오 파라미터 값들 (158), 제 2 스테레오 파라미터 (예를 들어, IPL) 의 특정 파라미터 값들, 또는 이들의 조합에 적용되지 않는다는 것을 결정할 수도 있다. 디코더 (118) 는 제 1 변동 임계, 제 2 변동 임계, 또는 양자 모두를 적응 가능하게 설정하여 아티팩트들을 감소 (예를 들어, 최소화) 시킬 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 도 2 내지 도 5 를 참조하여 추가로 설명된 바와 같이, 스테레오 파라미터 값들 (158) 에 기초하여 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 추정 함수 (예를 들어, 평균 함수, 조정 함수, 커브-피팅 함수) 를 스테레오 파라미터 값들 (158) 중 하나 이상에 적용함으로써 하나 이상의 컨디셔닝된 값들 (예를 들어, 컨디셔닝된 파라미터 값들) 을 포함하는 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 스테레오 파라미터 값들 (158) 은 제 1 주파수 범위 (152)(예를 들어, 200 Hz 내지 400 Hz) 에 대응하는 제 1 파라미터 값 (151) 및 제 2 주파수 범위 (156)(예를 들어, 400 Hz 내지 600 Hz) 에 대응하는 제 2 파라미터 값 (155), 또는 양자 모두를 포함할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 주파수 범위들의 세트에 대응하는 하나 이상의 컨디셔닝된 파라미터 값들을 결정할 수도 있다. 주파수 범위들의 세트는 제 1 주파수 범위 (152) 의 하나 이상의 서브세트들, 제 2 주파수 범위 (156) 의 하나 이상의 서브세트들, 또는 이들의 조합을 포함할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 적어도 제 1 파라미터 값 (151) 및 제 2 파라미터 값 (155) 에 기초하여 컨디셔닝된 파라미터 값들 (640) 의 컨디셔닝된 파라미터 값 (640) 을 결정할 수도 있다. 제 1 파라미터 값 (151) 및 제 2 파라미터 값 (155) 은 이전의 프레임 (또는 서브-프레임) 으로부터의 값들 또는 현재의 프레임 (또는 서브-프레임) 에 대응할 수도 있다. 컨디셔닝된 파라미터 값 (640) 은 적어도 제 1 주파수 범위 (152) 또는 제 2 주파수 범위 (156) 의 서브세트 (예를 들어, 서브-범위) 인 주파수 범위 (170) 에 대응할 수도 있다. 예를 들어, 주파수 범위 (170) 의 일부는 제 1 주파수 범위 (152) 의 서브세트에 대응할 수도 있고 주파수 범위 (170) 의 나머지 부분은 제 2 주파수 범위 (156) 의 서브세트에 대응할 수도 있다.
주파수 범위들의 세트는 컨디셔닝된 파라미터 값 (640) 에 대응하는 주파수 범위 (170) 를 포함할 수도 있다. 본원에 지칭된 바와 같이, "컨디셔닝된 파라미터 값" 은 비트스트림 (101) 에서 표시된 바와 같은 특정 주파수 범위에 대응하는 파라미터 값과는 상이한 특정 주파수 범위에 대해 디코더에 의해 사용된 또는 결정된 파라미터 값을 지칭한다.
스테레오 파라미터 컨디셔너 (618) 는 추정 함수를 사용하여 스테레오 파라미터 값들 (158) 을 국부적으로 또는 전체적으로 조정하여, 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 제 1 주파수 범위 (152) 의 제 1 파라미터 값 (151) 및 인접한 주파수 범위의 파라미터 값을 수정하는 것에 기초하여 제 1 주파수 범위 (152)(예를 들어, 주파수 대역) 의 서브세트 (예를 들어, 주파수 서브-범위 또는 주파수 빈) 인 주파수 범위 (170) 의 컨디셔닝된 파라미터 값 (640) 을 결정함으로써 스테레오 파라미터 값들 (158) 을 국부적으로 조정할 수도 있다. 따라서, 국부적 수정은 서로에게 바로 인접하는 2 개의 주파수 범위들, 예컨대 200 Hz 내지 400 Hz 의 주파수들의 제 1 대역 및 400 Hz 내지 600 Hz 의 주파수들의 제 2 대역에 걸쳐 특정 값들을 조정 (예를 들어, 평활화) 할 수도 있다. 이 예에서, 주파수 범위 (170)(예를 들어, 주파수 서브-범위 또는 주파수 빈) 의 컨디셔닝된 파라미터 값 (640) 은 하나 이상의 다른 (예를 들어, 비-인접한) 주파수 범위들의 파라미터 값들에 독립적일 수도 있다. 예시하기 위해, 스테레오 파라미터 값들 (158) 의 적어도 하나의 값은 제 1 주파수 범위 (152) 에 비-인접한 하나 이상의 주파수 범위들에 대응할 수도 있다. 컨디셔닝된 파라미터 값 (640) 은 적어도 하나의 값에 독립적일 수도 있다. 본원에 지칭된 바와 같이, 주파수 서브-범위의 "비-인접한 주파수 범위" 는 주파수 서브-범위를 포함하는 특정 주파수 범위에 바로 인접하지 않은 주파수 범위이다.
특정 구현에서, 주파수 범위 (170) 의 부분은 제 1 주파수 범위 (152) 의 서브세트일 수도 있고 주파수 범위 (170) 의 다른 부분은 제 2 주파수 범위 (156) 의 서브세트일 수도 있다. 예를 들어, 주파수 범위 (170) 의 제 1 부분은 제 1 주파수 범위 (152) 의 제 1 서브세트에 대응할 수도 있고 주파수 범위 (170) 의 나머지 부분은 제 2 주파수 범위 (156) 의 제 2 서브세트에 대응할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 제 1 주파수 범위 (152) 의 하나 이상의 파라미터 값들 (예를 들어, 제 1 파라미터 값 (151)) 및 제 2 주파수 범위 (156) 의 하나 이상의 파라미터 값들 (예를 들어, 제 2 파라미터 값 (155)) 에 기초하여 주파수 범위 (170) 의 컨디셔닝된 파라미터 값 (640) 을 결정함으로써 스테레오 파라미터 값들 (158) 을 국부적으로 조정할 수도 있다. 컨디셔닝된 파라미터 값 (640) 은 제 1 주파수 범위 (152) 및 제 2 주파수 범위 (156) 외의 주파수 범위들에 대응하는 파라미터 값들에 독립적일 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 의 일부 또는 전부를 커브 피팅함으로써 스테레오 파라미터 값들 (158) 전체를 조정할 수도 있다. 주파수 범위 (170) (예를 들어, 주파수 서브-범위 또는 주파수 빈) 의 컨디셔닝된 파라미터 값 (640) 은 하나 이상의 비-인접한 주파수 범위들의 파라미터 값들, 주파수 범위 (170) 보다 낮은 인접한 주파수 범위의 파라미터 값들, 또는 이들의 조합에 의존적일 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 을 주파수 대역들에 걸쳐 특정 (예를 들어, 고정된, 일정한, 또는 미리결정된) 값으로 설정함으로써 그들을 조정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 제 1 주파수 범위 (152) 의 각각의 주파수 빈 및 제 2 주파수 범위 (156) 의 각각의 주파수 빈에 대한 동일한 값 (예를 들어, 특정 값) 을 갖는 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 특정 값은 스테레오 파라미터 값들 (158), 근본적인 신호 특징들, 예컨대 에너지, 틸트, 스펙트럼 변동, 오버랩 윈도우 길이, 또는 이들의 조합에 기초할 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 근본적인 신호 특징들 (예를 들어, 중간-대역 에너지, 전력, 틸트 등) 에 기초하여 스테레오 파라미터 값들 (158) 을 조정함으로써 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 일부 환경들에서, 스테레오 파라미터 컨디셔너 (618) 는 근본적인 신호 특징들을 사용하여, 스테레오 파라미터 값들 (158)(또는 스테레오 파라미터 값들 (158) 의 서브세트) 을 조정할지 여부를 결정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 하나 이상의 근본적인 신호 특징들 (예를 들어, 중간-대역 에너지, 전력, 틸트, 또는 이들의 조합) 이 제 1 주파수 범위 (152)(예를 들어, 200 Hz 내지 400 Hz) 및 제 2 주파수 범위 (156)(예를 들어, 400 Hz 내지 600 Hz) 의 대략적으로 경계 (예를 들어, 400 Hz) 에서 임계를 충족 (예를 들어, 임계보다 큰, 임계 미만, 또는 임계와 동일한) 시킨다는 결정에 응답하여, 제 1 주파수 범위의 제 1 서브세트 및 제 2 주파수 범위의 제 2 서브세트에 대응하는 스테레오 파라미터 값들 (158) 을 조정하는 것을 억제할 수도 있다. 이 예에서, 제 1 주파수 범위의 제 1 서브세트 및 제 2 주파수 범위의 제 2 서브세트는 경계에 근접할 수도 있다. 중간 신호 에너지가 에너지 임계를 충족시키는 경우, 중간 신호 에너지는 제 1 주파수 범위 (152) 에 대응하는 제 1 파라미터 값 (151) 과 제 2 주파수 범위 (156) 에 대응하는 제 2 파라미터 값 (155) 간의 경계에서 차이의 지각을 감소시킬 수도 있다. 이 예에서, 스테레오 파라미터 값들 (159) 은 주파수 범위에 대응하는 비-조정된 파라미터 값을 나타낼 수도 있다. 예를 들어, 제 2 스테레오 파라미터 값들 (159) 은, 제 1 파라미터 값 (151)(예를 들어, 비-조정된 파라미터 값) 이 제 1 주파수 범위 (152) 의 제 1 서브세트에 대응한다는 것, 제 2 파라미터 값 (155) 이 제 2 주파수 범위 (156) 의 제 2 서브세트에 대응한다는 것, 또는 양자 모두를 나타낼 수도 있다.
일 구현에 따르면, 스테레오 파라미터 컨디셔너 (618) 는 특정 스테레오 파라미터에서의 변동이 임계를 충족 (예를 들어, 초과) 시키는지 여부를 결정할 수도 있다. 특정 스테레오 파라미터에서의 변동이 임계를 충족시키면, 스테레오 파라미터 컨디셔너 (618) 는 상이한 스테레오 파라미터를 조정한다. 비-제한적 예로서, 스테레오 파라미터 컨디셔너 (618) 는 ITD들 (예를 들어, 제 1 스테레오 파라미터) 의 값들에서의 변동이 임계를 충족시키는지 여부를 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 가 ITD들의 값들에서의 변동이 임계를 충족시킨다고 결정하면, 스테레오 파라미터 컨디셔너 (618) 는 IPD들 (예를 들어, 제 2 스테레오 파라미터) 와 연관된 값들을 조정 (예를 들어, 컨디셔닝) 한다. 업-믹서 (610) 는 주파수-도메인 디코딩된 중간 신호 (및 선택적으로는 주파수-도메인 디코딩된 사이드 신호) 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 (예를 들어, 도 6 에 예시된 바와 같은 제 1 주파수-도메인 출력 신호 (642)) 및 제 2 주파수-도메인 출력 신호 (예를 들어, 도 6 에 예시된 바와 같은 제 2 주파수-도메인 출력 신호 (644)) 를 생성하도록 구성된다. 업-믹스 동작 동안, 업-믹서 (610) 는 스테레오 파라미터 값들 (158) 을 주파수-도메인 디코딩된 중간 신호 (및 선택적으로는 주파수-도메인 디코딩된 사이드 신호) 에 적용할 수도 있다. 부가적으로, 업-믹스 동작 동안, 스테레오 프로세서 (620) 는 (컨디셔닝된 값 (640) 을 포함하는) 제 2 스테레오 파라미터 값들을 주파수-도메인 디코딩된 중간 신호 (및 선택적으로는 주파수-도메인 디코딩된 사이드 신호) 에 적용할 수도 있다. 컨디셔닝된 값 (640) 은 제 1 오버랩 사이즈보다 더 작은 제 2 오버랩 사이즈를 갖는 제 2 윈도우들을 사용하는 디코더-측 윈도윙 스킴을 사용하여 적용될 수도 있다. 디코더-측 윈도윙 스킴과 연관된 제 2 오버랩 사이즈는 인코더-측 윈도윙 스킴과 연관된 제 1 오버랩 사이즈와는 상이하다. 예를 들어, 제 2 오버랩 사이즈는 제 1 오버랩 사이즈보다 더 작다. 부가적으로, 제 1 제로-패딩 동작들은 인코더-측 윈도윙 스킴과 연관되어 인코더 (114) 에서 수행될 수도 있고, (제 1 제로-패딩 동작들과는 상이한) 제 2 제로-패딩 동작들은 디코더-측 윈도윙 스킴과 연관되어 디코더 (118) 에서 수행될 수도 있다.
역 변환 유닛 (622) 은 제 1 주파수-도메인 출력 신호 상에서 역 변환 동작을 수행하여 제 1 출력 신호 (126) 를 생성하도록 구성된다. 제 2 역 변환 유닛 (624) 은 제 2 주파수-도메인 출력 신호 상에서 역 변환 동작을 수행하여 제 2 출력 신호 (128) 를 생성하도록 구성된다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142) 를 통해 제 1 출력 신호 (126) 를 출력할 수도 있다. 제 2 디바이스 (106) 는 제 2 라우드스피커 (144) 를 통해 제 2 출력 신호 (128) 를 출력할 수도 있다. 대안의 예들에서, 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 는 스테레오 신호 쌍으로서 단일의 출력 라우드스피커로 송신될 수도 있다.
제 1 디바이스 (104) 및 제 2 디바이스 (106) 는 별개의 디바이스들로서 설명되었지만, 다른 구현들에서 제 1 디바이스 (104) 는 제 2 디바이스 (106) 를 참조하여 설명된 하나 이상의 컴포넌트들을 포함할 수도 있다. 부가적으로 또는 대안으로, 제 2 디바이스 (106) 는 제 1 디바이스 (140) 를 참조하여 설명된 하나 이상의 컴포넌트들을 포함할 수도 있다. 예를 들어, 단일의 디바이스는 인코더 (114), 디코더 (118), 송신기 (110), 수신기 (111), 하나 이상의 입력 인터페이스들 (112), 메모리 (153), 또는 이들의 조합을 포함할 수도 있다. 메모리 (153) 는 분석 데이터를 저장한다. 분석 데이터는 스테레오 파라미터 값들 (158), 제 2 스테레오 파라미터 값들 (159), 인코더 (144) 에 의해 적용될 제 1 윈도우를 정의하는 제 1 윈도우 파라미터들, 디코더 (118) 에 의해 적용될 제 2 윈도우를 정의하는 제 2 윈도우 파라미터들, 또는 이들의 조합을 포함할 수도 있다.
시스템 (100) 은 수신된 비트스트림 (101) 에서 표시되는 스테레오 파라미터 값들 (158) 에 기초하여 디코더 (118) 로 하여금 제 2 스테레오 파라미터 값들 (159) 을 생성하게 할 수도 있다. 제 2 스테레오 파라미터 값들 (159) 은 하나 이상의 컨디셔닝된 파라미터 값들을 포함할 수도 있다. 연속적인 주파수 범위들에 대응하는 제 2 스테레오 파라미터 값들 (159) 중 적어도 일부는, 동일한 주파수 범위들에 대응하는 스테레오 파라미터 값들 (158) 의 값들과 비교하여, 그들 간의 더 낮은 또는 동일한 분산을 가질 수도 있다. 연속적인 주파수 범위들에 대응하는 제 2 스테레오 파라미터 값들 (159) 의 값들에서의 더 작은 변화들 (또는 더 작은 분산) 은 더 적은 지각 가능한 아티팩트들을 갖는 출력 신호들 (예를 들어, 제 1 출력 신호 (126) 및 제 2 출력 신호 (128)) 을 초래하여, 이에 의해 출력 신호들의 오디오 품질을 개선시킨다.
도 2 내지 도 5 는 추정 함수를 파라미터 값들 (158) 에 적용함으로써 생성된 제 2 스테레오 파라미터 값들 (159) 의 다양한 비-제한적 예들을 예시한다. 도 2 는 조정 함수를 스테레오 파라미터 값들 (158) 에 적용함으로써 생성된 제 2 스테레오 파라미터 값들 (159) 의 예를 예시한다. 도 3 은 커브 피팅 함수를 스테레오 파라미터 값들 (158) 에 적용함으로써 생성된 제 2 스테레오 파라미터 값들 (159) 의 예를 예시한다. 도 4 는 선형 조정 함수를 스테레오 파라미터 값들 (158) 에 적용함으로써 생성된 제 2 스테레오 파라미터 값들 (159) 의 예를 예시한다. 도 5 는 구분적 선형 조정 함수를 스테레오 파라미터 값들 (158) 에 적용함으로써 생성된 제 2 스테레오 파라미터 값들 (159) 의 예를 예시한다.
도 2 를 참조하면, 스테레오 파라미터 값들 (158) 의 예 및 제 2 스테레오 파라미터 값들 (159) 의 예가 예시된다. 스테레오 파라미터 값들 (158) 은 주파수 대역 (0) 에 대응하는 파라미터 값 (202), 주파수 대역 (1) 에 대응하는 파라미터 값 (204), 주파수 대역 (2) 에 대응하는 파라미터 값 (206), 및 주파수 대역 (3) 에 대응하는 파라미터 값 (208) 을 포함한다. 주파수 대역들 (0-2) 중 하나는 제 1 주파수 범위 (152) 에 대응할 수도 있고 인접한 주파수 대역은 제 2 주파수 범위 (156) 에 대응할 수도 있다. 주파수 대역 (0) 은 0 의 주파수 대역 인덱스를 갖는 주파수 대역에 대응할 수도 있다. 연속적인 주파수 대역들은 연속적인 주파수 대역 인덱스들을 가질 수도 있다.
주파수 대역들 (0-3) 각각은 하나 이상의 주파수 빈들을 포함할 수도 있다. 예를 들어, 주파수 대역 (0) 은 단일의 주파수 빈 (예를 들어, 주파수 빈 (0)) 을 포함하고, 주파수 대역 (1) 은 주파수 빈 (1) 및 주파수 빈 (2) 을 포함하고, 주파수 대역 (2) 은 주파수 빈들 (3-6) 을 포함하며, 주파수 대역 (3) 은 주파수 빈들 (7-14) 을 포함한다. 주파수 빈 (0) 은 0 의 주파수 빈 인덱스를 갖는 주파수 빈에 대응할 수도 있다. 연속적인 주파수 빈들은 연속적인 주파수 빈 인덱스들을 가질 수도 있다.
도 1 의 스테레오 파라미터 컨디셔너 (618) 는 대역간 트랜지션들에 대응하는 스테레오 파라미터 값들 (158) 중 적어도 일부를 수정함으로써 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 선형 조정, 구분적 선형 조정, 또는 비-선형 조정을 수행할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 에 대응하는 하나 이상의 주파수 대역 경계들에 대한 조정을 수행할지 여부를 결정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (0) 과 주파수 대역 (1) 간의 경계에 대해 조정이 수행된다는 것 및 주파수 대역 (1) 과 주파수 대역 (2) 간의 경계에 대해 조정이 수행된다는 것을 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (2) 과 주파수 대역 (3) 간의 경계에 대해 조정이 수행되지 않는다는 것을 결정할 수도 있다. 특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는, 파라미터 값 (204) 과 파라미터 값 (206) 간의 차이가 파라미터 값 차이 암계를 충족시킨다는 결정에 응답하여 제 1 주파수 범위 (152) 와 제 2 주파수 범위 (156) 간의 경계에 대해 조정이 수행된다는 것을 결정한다.
스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (0) 과 주파수 대역 (1) 간의 경계에 대해 조정이 수행된다는 결정에 응답하여, 주파수 대역 (0) 의 파라미터 값 (202) 과 주파수 대역 (1) 의 파라미터 값 (204) 간의 주파수 빈 (1) 에 대응하는 파라미터 값 (210)(예를 들어, 컨디셔닝된 파라미터 값) 을 결정할 수도 있다. 제 2 스테레오 파라미터 값들 (159) 은 주파수 빈 (0) 에 대응하는 파라미터 값 (202), 주파수 빈 (1) 에 대응하는 파라미터 값 (210), 및 주파수 빈 (2) 에 대응하는 파라미터 값 (204) 을 포함할 수도 있다. 파라미터 값 (202) 과 파라미터 값 (210) 간의 차이는 파라미터 값 (202) 과 파라미터 값 (204) 간의 차이보다 낮고, 이에 의해 도 1 의 디코더 (118) 에 의해 생성된 출력 신호들에서 주파수 대역 (0) 및 주파수 대역 (1) 의 경계에서 더 적은 아티팩트들을 초래한다.
스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (1) 과 주파수 대역 (2) 간의 경계에 대해 조정이 수행된다는 결정에 응답하여, 주파수 빈 (2) 에 대응하는 파라미터 값 (204) 과 주파수 대역 (2) 에 대응하는 파라미터 값 (206) 간의 하나 이상의 컨디셔닝된 파라미터 값들을 결정할 수도 있다. 하나 이상의 컨디셔닝된 파라미터 값들은 주파수 빈들 (3-5) 에 대응할 수도 있다. 예를 들어, 하나 이상의 컨디셔닝된 파라미터 값들은 주파수 빈 (4) 에 대응하는 파라미터 값 (212)(예를 들어, 컨디셔닝된 파라미터 값) 을 포함할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 파라미터 값 (206) 이 주파수 빈 (6) 에 대응한다는 것을 결정할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (2) 과 주파수 대역 (3) 간의 경계에 대해 조정이 수행되지 않는다는 결정에 응답하여, 제 2 스테레오 파라미터 값들 (159) 을 주파수 대역 (3) 의 각각의 주파수 빈에 대응하는 파라미터 값 (206) 을 포함하도록 업데이트할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 따라서, 스테레오 파라미터 값들 (158) 의 2 이상의 파라미터 값들을 조정하여 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 일부 주파수 대역 경계들에 걸쳐 파라미터 값들을 조정하는 것은 도 1 의 디코더 (118) 에 의해 생성된 출력 신호들에서 아티팩트들을 감소시킬 수도 있다.
도 3 을 참조하면, 스테레오 파라미터 값들 (158) 의 예 및 제 2 스테레오 파라미터 값들 (159) 의 예가 예시된다. 스테레오 파라미터 값들 (158) 은 주파수 대역 (0) 에 대응하는 파라미터 값 (302), 주파수 대역 (1) 에 대응하는 파라미터 값 (304), 주파수 대역 (2) 에 대응하는 파라미터 값 (306), 및 주파수 대역 (3) 에 대응하는 파라미터 값 (308) 을 포함한다.
도 1 의 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 의 적어도 일부를 커브-피팅함으로써 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158) 의 비-국부적 조정을 수행하여 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예시하기 위해, 주파수 빈에 대응하는 제 2 스테레오 파라미터 값들 (159) 의 파라미터 값은 하나 이상의 비-인접한 주파수 대역들에 대응하는 스테레오 파라미터 값들 (158) 의 파라미터 값들에 기초하여 결정될 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (0) 의 파라미터 값 (302), 주파수 대역 (2) 의 파라미터 값 (306), 주파수 대역 (3) 의 파라미터 값 (308), 또는 이들의 조합에 기초하여 주파수 대역 (1) 에서 주파수 빈 (2) 의 파라미터 값 (310) 을 결정할 수도 있다. 주파수 대역 (0) 및 주파수 대역 (2) 은, 주파수 대역 (1) 이 주파수 대역 (0) 및 주파수 대역 (2) 에 인접하기 때문에 주파수 빈 (2) 의 인접한 주파수 대역들로 간주될 수도 있다. 주파수 대역 (3) 은, 주파수 대역 (1) 이 주파수 대역 (3) 에 인접하지 않기 때문에 비-인접한 주파수 대역으로 간주될 수도 있다.
제 2 스테레오 파라미터 값들 (159) 은 주파수 빈 (0) 에 대응하는 파라미터 값 (302) 을 포함한다. 제 2 스테레오 파라미터 값들 (159) 은 주파수 빈들 (1-14) 각각에 대응하는 컨디셔닝된 파라미터 값을 포함한다. 예를 들어, 제 2 스테레오 파라미터 값들 (159) 은 주파수 빈 (2) 에 대응하는 파라미터 값 (310)(예를 들어, 컨디셔닝된 파라미터 값) 을 포함한다. 파라미터 값 (310) 은 파라미터 값 (302), 파라미터 값 (308), 파라미터 값 (304), 및 파라미터 값 (306) 을 커브-피팅하는 것에 기초할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 대응하는 파라미터 값에서 각각의 대역의 중간-범위를 교차하는 라인 (예를 들어, 굴곡진 라인) 을 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 라인을 근사하도록 제 2 스테레오 파라미터 값들 (159) 을 결정할 수도 있다. 파라미터 값 (310) 은 주파수 빈 (2) 에 대응하는 라인의 값을 근사할 수도 있다. 파라미터 값 (310) 은 따라서, 인접한 및 비-인접한 주파수 대역들에 대응하는 스테레오 파라미터 값들 (158) 에 기초할 수도 있다.
도 4 를 참조하면, 스테레오 파라미터 값들 (158) 의 예 및 제 2 스테레오 파라미터 값들 (159) 의 예가 예시된다. 스테레오 파라미터 값들 (158) 은 주파수 대역 (0) 에 대응하는 파라미터 값 (402), 주파수 대역 (1) 에 대응하는 파라미터 값 (404), 주파수 대역 (2) 에 대응하는 파라미터 값 (406), 및 주파수 대역 (3) 에 대응하는 파라미터 값 (408) 을 포함한다.
제 2 스테레오 파라미터 값들 (159) 을 생성하는 것은 일부 주파수 대역들의 주파수 빈들에 대응하는 파라미터 값들을 동일한 파라미터 값으로 설정하는 것을 포함할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 주파수 임계 (예를 들어, 주파수 대역 (2)) 보다 더 낮은 (또는 더 높은) 주파수 대역들에 대응하는 파라미터 값들이 중요한 공간 정보에 기여하지 않는다는 것을 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 더 낮은 (또는 더 높은) 주파수 대역들에 대응하는 주파수 빈들에 대한 일정한 파라미터 값들을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 스테레오 파라미터 값들 (158) 이 주파수 대역 (2) 에 대응하는 파라미터 값 (406) 을 포함한다는 결정에 응답하여, 주파수 대역 (0) 및 주파수 대역 (1) 의 주파수 빈들 (0-2) 에 대응하는 파라미터 값 (406) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 다른 예로서, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (3) 보다 더 높은 하나 이상의 주파수 대역들의 주파수 빈들에 대응하는 파라미터 값 (408) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 추정 (예를 들어, 평균, 조정, 커브 피팅) 함수에 기초하여 나머지 주파수 빈들에 대응하는 파라미터 값들을 결정할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 파라미터 값 (406) 및 파라미터 값 (408) 에 기초하여 선형 조정을 수행하여 주파수 대역 (2) 및 주파수 대역 (3) 의 주파수 빈들 중 적어도 일부에 대응하는 파라미터 값들을 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (2) 의 주파수 빈들 (3-6) 각각에 대응하는 파라미터 값 (406) 및 주파수 대역 (3) 의 주파수 빈들 (10-14) 각각에 대응하는 파라미터 값 (408) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성 (또는 업데이트) 할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 파라미터 값 (406) 및 파라미터 값 (408) 에 기초하여 선형 조정을 수행하여 주파수 대역 (3) 의 주파수 빈들 (7-9) 에 대응하는 파라미터 값들을 결정할 수도 있고, 주파수 빈들 (7-9) 에 대응하는 파라미터 값들을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성 (또는 업데이트) 할 수도 있다.
도 4 에서, 주파수 대역 (3) 의 주파수 빈들 (7-9) 에 대응하는 파라미터 값들을 결정하도록 선형 조정이 수행된다. 특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (2) 의 적어도 일부 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 선형 조정을 수행할 수도 있다. 대안의 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (2) 의 적어도 일부 주파수 빈들에 대응하는 파라미터 값들 및 주파수 대역 (3) 의 적어도 일부 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 조정 (예를 들어, 선형 조정 또는 비-선형 조정) 을 수행할 수도 있다. 특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 근본적인 신호 특징들 (예를 들어, 에너지) 에 기초하여, 주파수 대역 (2), 주파수 대역 (3), 또는 양자 모두의 적어도 일부 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 선형 조정을 수행할지 여부를 결정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역의 에너지 분산 (또는 평균 에너지) 가 임계를 충족시킨다 (예를 들어, 임계보다 크다) 는 결정에 응답하여 주파수 대역 (예를 들어, 주파수 대역 (2) 또는 주파수 대역 (3)) 의 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 선형 조정을 수행할 수도 있다.
도 4 에 예시된 바와 같이, 주파수 대역 (2) 에 대응하는 스테레오 파라미터 값들 (158) 의 파라미터 값 (406) 은 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역 (0) 및 주파수 대역 (1) 에 할당된다. 동일한 파라미터 값 (예를 들어, 파라미터 값 (406)) 은, 인접한 주파수 대역들이 지각적 품질을 거의 갖지 않거나 또는 이에 영향을 미치지 않는다는 결정에 응답하여 파라미터 트랜지션을 감소시키도록 제 2 스테레오 파라미터 값들 (159) 에서 하나 이상의 인접한 주파수 대역들에 할당될 수도 있다. 파라미터 값 (406) 을 주파수 대역 (0) 및 주파수 대역 (1) 에 할당하는 것은 주파수 대역 (0) 과 주파수 대역 (1) 간 및 주파수 대역 (1) 과 주파수 대역 (2) 간의 (스테레오 파라미터 값들 (158) 에 대응하는) 스테레오 파라미터의 값에서의 트랜지션을 감소 (예를 들어, 회피) 시킬 수도 있다. 대안의 구현에서, 스테레오 파라미터 컨디셔너 (618) 는, 스테레오 파라미터 값들 (158) 에 기초하여 하나 이상의 다른 파라미터 값들을 제 2 스테레오 파라미터 값들 (159) 에서의 주파수 대역들 (0, 1 및 2) 에 할당할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 근본적인 중간 신호에 기초하여 주파수 대역 (0) 이 주파수 대역들 (1 및 2) 보다 더 높은 지각적 중요성을 갖는다는 것을 결정할 수도 있다. 예시하기 위해, 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (0) 의 주파수 빈이 다른 주파수 대역의 하나 이상 (예를 들어, 모든) 의 주파수 빈들보다 더 높은 에너지를 갖는다는 결정에 응답하여 주파수 대역 (0) 이 다른 주파수 대역 (예를 들어, 주파수 대역 (1) 또는 주파수 대역 (2)) 보다 더 높은 지각적 중요성을 갖는다는 것을 결정할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (0) 이 주파수 대역들 (1 및 2) 보다 더 높은 지각적 중요성을 갖는다는 결정에 응답하여, 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역들 (1 및 2) 에 (주파수 대역 (0) 에 대응하는) 파라미터 값 (402) 을 할당할 수도 있다. 다른 예로서, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (158)(예를 들어, 파라미터 값들 (402, 404, 및 406)) 중 하나 이상의 가중된 평균을 제 2 스테레오 파라미터 값들 (159) 에서의 주파수 대역들 (0, 1 및 2) 에 할당할 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 값들 (159) 을 적응 가능하게 결정할 수도 있다. 적응적 결정은 중간 신호에서 주파수 대역들의 상대적인 에너지 분포들에 기초할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 제 2 스테레오 파라미터 값들 (159) 에서 비트스트림 (101) 을 통해 수신된 스테레오 파라미터 값들 (158) 중 하나 이상의 변위를 인에이블 또는 디스에이블할지 여부를 적응 가능하게 결정할 수도 있다. 예시하기 위해, 스테레오 파라미터 컨디셔너 (618) 는, 중간 신호에서 주파수 대역들 (0, 1, 및 2) 의 상대적인 에너지 분포들에 기초하여, 스테레오 파라미터 값들 (158) 의 파라미터 값들 (402, 404, 및 406) 이 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역들 (0, 1, 및 2) 에 대응하는 단일의 파라미터 값으로 대체되는지 여부를 적응 가능하게 결정할 수도 있다. 다른 예로서, 스테레오 파라미터 컨디셔너 (618) 는, 스테레오 파라미터 값 (158) 의 대응하는 파라미터 값들이 제 2 스테레오 파라미터 값들 (159) 에서 단일의 파라미터 값에 의해 대체되는 주파수 대역들 (예를 들어, 2 개의 주파수 대역들 또는 3 개의 주파수 대역들) 의 수를 적응 가능하게 결정할 수도 있다. 예시하기 위해, 스테레오 파라미터 컨디셔너 (618) 는, 스테레오 파라미터 값들 (158) 의 파라미터 값 (402), 파라미터 값 (404), 및 파라미터 값 (406) 이 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역들 (0, 1, 및 2)(예를 들어, 3 개의 주파수 대역들) 에 대응하는 단일의 파라미터 값으로 대체된다는 것을 적응 가능하게 결정할 수도 있다. 대안으로, 스테레오 파라미터 컨디셔너 (618) 는, 파라미터 값 (402) 및 파라미터 값 (404) 이 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역들 (0 및 1)(예를 들어, 2 개의 주파수 대역들) 에 대응하는 단일의 파라미터 값으로 대체되는 반면에, 파라미터 값 (406) 은 제 2 스테레오 파라미터 값들 (159) 에서 주파수 대역 (2) 에 대응한다는 것을 적응 가능하게 결정할 수도 있다. 특정 주파수 대역들 (예를 들어, 주파수 대역들 (0, 1 또는 2)) 이 예시적 목적을 위해 사용되고 비-제한적이라는 것이 주목되어야 한다. 다양한 구현들에서, 주파수 대역들의 임의의 조합이 사용될 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 스테레오 파라미터 (예를 들어, IPD) 의 스테레오 파라미터 값들 (158) 의 국부적 조정을 수행하여 제 2 스테레오 파라미터 값들 (159) 의 제 1 서브세트를 결정할 수도 있고 스테레오 파라미터 값들 (158) 의 전체 조정을 수행하여 제 2 스테레오 파라미터 값들 (159) 의 제 2 서브세트를 결정할 수도 있다. 예를 들어, 도 4 에 예시된 바와 같이, 주파수 대역 (2) 의 파라미터 값 (406) 을 주파수 대역 (0) 에 할당하는 것은, 주파수 대역 (2) 이 주파수 대역 (0) 에 비-인접하기 때문에 스테레오 파라미터 값들 (158) 의 전체 (예를 들어, 전반적인) 조정에 대응할 수도 있다. 주파수 대역 (3) 에 할당된 제 2 스테레오 파라미터 값들 (159) 의 하나 이상의 파라미터 값들은, 하나 이상의 파라미터 값들이 주파수 대역 (2) 및 주파수 대역 (3) 에 대응하는 스테레오 파라미터 값들 (158) 의 파라미터 값들에 기초하기 때문에 스테레오 파라미터 값들 (158) 의 국부적 조정에 대응할 수도 있고, 여기서 주파수 대역 (2) 은 주파수 대역 (3) 에 인접한다.
도 5 를 참조하면, 스테레오 파라미터 값들 (158) 의 예 및 제 2 스테레오 파라미터 값들 (159) 의 예가 예시된다. 스테레오 파라미터 값들 (158) 은 주파수 대역 (0) 에 대응하는 파라미터 값 (502), 주파수 대역 (1) 에 대응하는 파라미터 값 (504), 주파수 대역 (2) 에 대응하는 파라미터 값 (506), 및 주파수 대역 (3) 에 대응하는 파라미터 값 (508) 을 포함한다.
도 1 의 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역들의 파라미터 값들 상에서 조정을 수행함으로써 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역의 파라미터 값과 인접한 주파수 대역의 파라미터 값 간의 차이에 기초하여 주파수 대역의 주파수 빈들의 파라미터 값들을 결정할 수도 있다. 예시하기 위해, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (3) 의 파라미터 값 (508) 과 주파수 대역 (2) 의 파라미터 값 (506) 간의 차이에 기초하여 주파수 빈 (7) 에 대응하는 파라미터 값 (510) 을 결정할 수도 있고, 여기서 주파수 대역 (2) 은 주파수 대역 (3) 에 인접한다. 특정 주파수 빈 (예를 들어, 주파수 빈 (7)) 에 대응하는 차이 (예를 들어, 파라미터 값 (506) - 파라미터 값 (508)) 의 양 (예를 들어, 부분) 은 본원에 설명된 바와 같이, 근본적인 신호 특징들 (예를 들어, 중간 신호 에너지) 에 기초할 수도 있다. 보다 구체적으로, 도 1 의 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역들의 파라미터 값들 상에서 구분적 선형 조정을 수행함으로써 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역의 파라미터 값과 인접한 주파수 대역의 파라미터 값 간의 차이에 기초하여 주파수 대역의 주파수 빈들의 파라미터 값들을 결정할 수도 있다. 특정 주파수 빈에 대응하는 차이의 양은 근본적인 신호 특징들 (예를 들어, 중간 신호 에너지) 에 비례할 수도 있다.
특정 양태에서, 스테레오 파라미터 값들 (158) 의 전체 (예를 들어, 전반적인) 조정은 근본적인 신호 특징들에 기초할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 가중된 에러를 감소 (예를 들어, 최소화) 시킴으로써 커브 (예를 들어, 최선의 피트 커브) 를 결정하도록 커브 피팅을 수행할 수도 있다. 이 예에서, 가중된 에러는 근본적인 중간 신호의 주파수 빈들에 대응하는 에너지들에 대응하는 가중치들을 사용하여 결정될 수도 있고, 에러 값들은 디바이스 (106) 에 의해 수신된 스테레오 파라미터 값들 (158) 과 제 2 스테레오 파라미터 값들 (159) 간의 차이들에 기초하여 결정될 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 특정 주파수 대역 (예를 들어, 주파수 대역 (2)) 보다 더 높은 (또는 더 낮은) 주파수 대역 상에서 구분적 선형 조정을 수행할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (0) 및 주파수 대역 (1) 이 주파수 대역 (2) 보다 더 낮다는 결정에 응답하여, 주파수 빈들 (0-2) 의 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 구분적 선형 조정을 수행하는 것을 억제할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 도 5 에 예시된 바와 같이 주파수 빈 (0) 에 대응하는 파라미터 값 (502) 및 주파수 빈들 (1-2) 각각에 대응하는 파라미터 값 (504) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다. 대안의 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 주파수 빈들 (0-2) 에 대응하는 파라미터 값 (506) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성할 수도 있다.
특정 양태에서, 스테레오 파라미터 컨디셔너 (618) 는 적어도 임계 수 (예를 들어, 5) 의 주파수 빈들을 포함하는 주파수 대역 상에서 구분적 선형 조정을 수행할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (2) 이 주파수 빈들의 임계 수 (예를 들어, 5) 미만인 수 (예를 들어, 4) 의 주파수 빈들을 포함한다는 결정에 응답하여, 주파수 대역 (2) 의 주파수 빈들에 대응하는 파라미터 값들을 결정하도록 구분적 선형 조정을 수행하는 것을 억제할 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 주파수 대역 (2) 의 주파수 빈들 (3-6) 각각에 대응하는 파라미터 값 (506) 을 포함하도록 제 2 스테레오 파라미터 값들 (159) 을 생성 (또는 업데이트) 할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는, 주파수 대역 (3) 이 주파수 대역 (2) 보다 높다는 것, 주파수 대역 (3) 의 주파수 빈들의 카운트 (예를 들어, 8) 가 주파수 빈들의 임계 수 (예를 들어, 5) 를 초과한다는 것, 또는 양자 모두를 결정하는 것에 응답하여, 파라미터 값 (506) 및 파라미터 값 (508) 에 기초하여 구분적 선형 조정을 수행함으로써 주파수 빈들 (7-10) 에 대응하는 파라미터 값들을 결정할 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 주파수 빈들 (7-10) 에 걸쳐 파라미터 값 (506) 과 파라미터 값 (508) 간의 차이를 확산시킬 수도 있다. 스테레오 파라미터 컨디셔너 (618) 는 특정 빈에 대응하는 근본적인 신호 특징들 (예를 들어, 중간 신호 에너지) 에 기초하여 특정 빈에 대응하는 차이의 비율을 결정할 수도 있다. 주파수 빈 (7) 에 대응하는 파라미터 값과 주파수 빈 (8) 에 대응하는 파라미터 값 간의 차이는 주파수 빈 (8) 에 대응하는 파라미터 값과 주파수 빈 (9) 에 대응하는 파라미터 값 간의 차이와 동일하거나, 또는 이와는 다를 수도 있다. 예를 들어, 주파수 빈 (7) 에 대응하는 파라미터 값과 주파수 빈 (8) 에 대응하는 파라미터 값 간의 라인 (예를 들어, 직선) 의 제 1 슬로프는 주파수 빈 (8) 에 대응하는 파라미터 값과 주파수 빈 (9) 에 대응하는 파라미터 값 간의 라인 (514)(예를 들어, 직선) 의 제 2 슬로프와 동일하거나, 또는 이와는 다를 수도 있다. 제 1 슬로프 및 제 2 슬로프는 주파수 빈들 (7-9) 에 대응하는 근본적인 신호 특징들 (예를 들어, 중간 신호 에너지) 에 기초할 수도 있다.
스테레오 파라미터 컨디셔너 (618) 는 따라서, 대응하는 주파수 빈들의 근본적인 신호 특징들에 기초하는 구분적 선형 조정을 수행함으로써 제 2 스테레오 파라미터 값들 (159) 중 적어도 일부를 결정할 수도 있다. 주파수 빈의 근본적인 신호 특징들은, 주파수 빈의 파라미터 값과 인접한 빈의 파라미터 값 간의 차이가 도 1 의 디코더 (118) 에 의해 생성된 출력 신호에서 더 많이 또는 더 적게 감지될 것 같은지 여부를 나타낼 수도 있다. 근본적인 신호 특징들에 기초하여 구분적 선형 조정을 수행하는 것은 출력 신호에서 지각 가능한 아티팩트들을 감소 (예를 들어, 최소화) 시킬 수도 있다.
도 6 을 참조하면, 디코더 (118) 의 특정 구현을 예시하는 다이어그램이 도시된다. 디코더 (118) 는 디멀티플렉서 (DEMUX)(602), 중간 신호 디코더 (604), 변환 유닛 (606), 업-믹서 (610), 사이드 신호 디코더 (612), 변환 유닛 (614), 스테레오 디코더 (616), 스테레오 파라미터 컨디셔너 (618), 역 변환 유닛 (622), 및 역 변환 유닛 (624) 을 포함한다. 업-믹서 (610) 는 스테레오 프로세서 (620) 를 포함한다.
비트스트림 (101) 이 디멀티플렉서 (602) 에 제공된다. 비트스트림 (101) 은 인코딩된 중간 신호 (102), 인코딩된 사이드 신호 (103), 및 인코딩된 스테레오 파라미터 정보 (158) 를 포함한다. 디멀티플렉서 (602) 는 비트스트림 (101) 으로부터 인코딩된 중간 신호 (102) 를 추출하고 인코딩된 중간 신호 (102) 를 중간 신호 디코더 (604) 에 제공하도록 구성된다. 디멀티플렉서 (602) 는 또한, 비트스트림 (101) 으로부터 인코딩된 사이드 신호 (103) 를 추출하고 인코딩된 사이드 신호 (103) 를 사이드 신호 디코더 (612) 에 제공하도록 구성될 수도 있다. 디멀티플렉서 (602) 는 또한, 비트스트림 (101) 으로부터 인코딩된 스테레오 파라미터 정보 (158) 를 추출하고 인코딩된 스테레오 파라미터 정보 (158) 를 스테레오 디코더 (616) 에 제공하도록 구성될 수도 있다.
중간 신호 디코더 (604) 는 인코딩된 중간 신호 (102) 를 디코딩하여 디코딩된 중간 신호 (630) (예를 들어, 중간-대역 신호 (MCODED(t))) 를 생성하도록 구성된다. 디코딩된 중간 신호 (630) 는 변환 유닛 (606) 에 제공된다. 변환 유닛 (606) 은 디코딩된 중간 신호 (630) 상에서 변환 동작을 수행하여 주파수-도메인 디코딩된 중간 신호 (MCODED(b)) (632) 를 생성하도록 구성된다. 예를 들어, 변환 유닛 (602) 은 디코딩된 중간 신호 (630) 상에서 이산 푸리에 변환 (DFT) 동작을 수행하여 주파수-도메인 디코딩된 중간 신호 (632) 를 생성할 수도 있다. 변환 유닛 (606) 은 제 1 오버랩 사이즈보다 더 작은 제 2 오버랩 사이즈를 갖는 제 2 윈도우들을 사용하는 디코더-측 윈도윙 스킴을 구현할 수도 있다. 주파수-도메인 디코딩된 중간 신호 (632) 는 업-믹서 (610) 에 제공된다.
사이드 신호 디코더 (612) 는 인코딩된 사이드 신호 (103) 를 디코딩하여 디코딩된 사이드 신호 (634) 를 생성하도록 구성된다. 디코딩된 사이드 신호 (634) 는 변환 유닛 (614) 에 제공된다. 변환 유닛 (614) 은 디코딩된 사이드 신호 (634) 상에서 변환 동작을 수행하여 주파수-도메인 디코딩된 사이드 신호 (636) 를 생성하도록 구성된다. 예를 들어, 변환 유닛 (602) 은 디코딩된 사이드 신호 (634) 상에서 DFT 동작을 수행하여 주파수-도메인 사이드 신호 (636) 를 생성할 수도 있다. 변환 유닛 (614) 은 제 1 오버랩 사이즈보다 더 작은 제 2 오버랩 사이즈를 갖는 제 2 윈도우들을 사용하는 디코더-측 윈도윙 스킴을 구현할 수도 있다. 주파수-도메인 사이드 신호 (636) 는 업-믹서 (610) 에 제공된다.
스테레오 디코더 (616) 는 인코딩된 스테레오 파라미터 정보 (158) 를 디코딩하여 스테레오 파라미터의 제 1 값 (151) 및 스테레오 파라미터의 제 2 값 (155) 을 결정하도록 구성된다. 제 1 값 (151) 은 제 1 주파수 범위 (152) 와 연관되고, 제 1 값 (151) 은 제 1 오버랩 사이즈를 갖는 제 1 윈도우들을 사용하는 (도 1 의 인코더 (114) 의) 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값 (155) 은 제 2 주파수 범위 (156) 와 연관되고, 제 2 값 (155) 은 인코더-측 윈도윙 스킴을 사용하여 또한 결정된다. 스테레오 파라미터의 제 1 값 (151) 및 스테레오 파라미터의 제 2 값 (155) 은 스테레오 파라미터 컨디셔너 (618) 에 제공된다.
부가적으로, 스테레오 디코더 (638) 는 인코딩된 스테레오 파라미터 정보 (158) 를 디코딩하는 것에 응답하여 비트스트림 (101) 으로 인코딩된 각각의 스테레오 파라미터에 대한 (제 1 값 (151) 및 제 2 값 (155) 을 포함하는) 스테레오 파라미터 값들 (638) 을 결정할 수도 있다. 스테레오 파라미터 값들 (638) 은 업-믹서 (610) 에 제공된다. 일 구현에 따르면, 스테레오 파라미터 값들 (638) 은 또한, 스테레오 파라미터 컨디셔너 (618) 에 제공된다.
스테레오 파라미터 컨디셔너 (618) 는 제 1 값 (151) 및 제 2 값 (155) 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값 (640) 을 생성하도록 구성된다. 컨디셔닝된 값 (640) 은 제 1 주파수 범위 (152) 의 서브세트 또는 제 2 주파수 범위 (156) 의 서브세트인 특정 주파수 범위 (170) 와 연관될 수도 있다. 예를 들어, 스테레오 파라미터 컨디셔너 (618) 는 제 1 값 (151) 및 제 2 값 (155) 에 추정 함수를 적용할 수도 있다. 추정 함수는 평균 함수, 조정 함수, 또는 커브-피팅 함수를 포함할 수도 있다. 특정 주파수 범위 (170) 가 제 1 주파수 범위 (152) 의 서브세트이면, 컨디셔닝된 값 (640) 은 제 1 값 (151) 과는 별개이다. 특정 주파수 범위 (170) 가 제 2 주파수 범위 (156) 의 서브세트이면, 컨디셔닝된 값 (640) 은 제 2 값 (155) 과는 별개이다. 컨디셔닝된 값 (640) 은 업-믹서 (610) 에 제공된다. 스테레오 파라미터 컨디셔너 (618) 는 또한, 컨디셔닝 동작에 기초하여 스테레오 파라미터의 하나 이상의 추가적인 컨디션 값들 (미도시) 을 생성하도록 구성될 수도 있다. 하나 이상의 추가적인 컨디션 값들의 각각의 컨디션 값은 제 1 주파수 범위 (152) 의 서브세트 또는 제 2 주파수 범위 (156) 의 서브세트인 대응하는 주파수 범위와 연관된다.
업-믹서 (610) 는 주파수-도메인 디코딩된 중간 신호 (632)(및 선택적으로는 주파수-도메인 디코딩된 사이드 신호 (636)) 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 (642) 및 제 2 주파수-도메인 출력 신호 (644) 를 생성하도록 구성된다. 업-믹스 동작 동안, 업-믹서 (610) 의 스테레오 프로세서 (620) 는 스테레오 파라미터 값들 (636) 을 주파수-도메인 디코딩된 중간 신호 (632) (및 선택적으로는 주파수-도메인 디코딩된 사이드 신호 (636)) 에 적용할 수도 있다. 부가적으로, 업-믹스 동작 동안, 스테레오 프로세서 (620) 는 컨디셔닝된 값 (640) 을 주파수-도메인 디코딩된 중간 신호 (632)(및 선택적으로는 주파수-도메인 디코딩된 사이드 신호 (636)) 에 적용할 수도 있다. 제 1 주파수-도메인 출력 신호 (642) 는 역 변환 유닛 (622) 에 제공되고, 제 2 주파수-도메인 출력 신호 (644) 는 역 변환 유닛 (624) 에 제공된다.
역 변환 유닛 (622) 은 제 1 주파수-도메인 출력 신호 (642) 상에서 역 변환 동작을 수행하여 제 1 출력 신호 (126) 를 생성하도록 구성된다. 예를 들어, 역 변환 유닛 (622) 은 제 1 주파수-도메인 출력 신호 (642) 상에서 역 DFT (IDFT) 동작을 수행하여 제 1 출력 신호 (126) 를 생성할 수도 있다. 제 2 역 변환 유닛 (624) 은 제 2 주파수-도메인 출력 신호 (644) 상에서 역 변환 동작을 수행하여 제 2 출력 신호 (128) 를 생성하도록 구성된다. 예를 들어, 제 2 역 변환 유닛 (624) 은 제 2 주파수-도메인 출력 신호 (644) 상에서 IDFT 동작을 수행하여 출력 신호 (128) 를 생성할 수도 있다.
인코더, 예컨대 도 1 의 인코더 (114) 는 제 1 윈도우 파라미터들과 연관된 제 1 윈도윙 스킴 (예를 들어, 인코더-측 윈도윙 스킴) 을 적용하도록 구성된다. 변환 유닛들 (606, 614) 은 제 2 윈도우 파라미터들과 연관된 제 2 윈도윙 스킴 (예를 들어, 디코더-측 윈도윙 스킴) 을 적용하도록 구성된다. 변환 유닛들 (606, 614) 에 의해 사용된 제 2 윈도윙 스킴과 연관된 제 2 윈도윙 파라미터들은 인코더 (114) 에 의해 사용된 제 1 윈도윙 스킴과 연관된 제 1 윈도우 파라미터들과 상이할 수도 있다. 변환 유닛들 (606, 614) 은 제 2 윈도윙 스킴을 사용하여 디코딩에서의 지연을 감소시킬 수도 있다. 예를 들어, (디코더 (118) 에 의해 적용된) 제 2 윈도윙 스킴은 (인코더 (114) 에 의해 적용된) 제 1 윈도윙에서 사용된 윈도우들과 동일한 사이즈를 갖는 윈도우들을 포함하므로, 변환이 동일한 주파수 대역들을 초래할 수도 있지만, 윈도우 오버랩의 양은 감소될 수도 있다. 예시하기 위해, 디코더 (118) 는 제 2 윈도우 오버랩 사이즈를 적용하여 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자 모두를 인코딩하기 위해 인코더 (114) 에 의해 사용된 제 1 윈도우 오버랩 사이즈와는 별개인, 제 1 출력 신호 (126), 제 2 출력 신호 (128), 또는 양자 모두를 생성할 수도 있다. 윈도우 오버랩의 양을 감소시키는 것은 이전의 윈도우로부터 오버랩된 샘플들을 프로세싱하는 것의 디코딩 지연을 감소시킨다. 제 1 값 (151) 및 제 2 값 (155) 이 (인코더 (114) 에 의해 적용된) 제 1 윈도윙 스킴에 기초하여 생성될 수도 있기 때문에, 디코더 (118) 는 도 1 내지 도 5 를 참조하여 설명된 바와 같이, 윈도윙 스킴들에서의 차이들을 고려하도록 컨디셔닝된 값 (640) 을 생성할 수도 있다. 예를 들어, 디코더 (118)(예를 들어, 스테레오 파라미터 컨디셔너 (618)) 는 수신된 스테레오 파라미터 값들의 보간 (예를 들어, 가중된 합들) 을 통해 스테레오 파라미터 값들을 생성할 수도 있다. 유사하게, 역 변환 유닛들 (622, 624) 은 역 변환들을 수행하여 주파수-도메인 신호들을 오버랩핑 윈도윙된 시간-도메인 신호들로 리턴하도록 구성된다.
도 6 에 대하여 설명된 스테레오 다운-믹싱 및 스테레오 업-믹싱 기법들은 단일의 채널과 연관되지만, 유사한 기법들이 사용되어 다수의 채널들에 대한 다운-믹싱 및 업-믹싱을 수행할 수도 있다. 예를 들어, 도 6 에 대하여 설명된 스테레오 파라미터 컨디셔너 기법들은, 스테레오 파라미터 컨디셔너가 하나 이상의 채널들로부터의 공간적 사이드 정보 (예를 들어, 이득, 위상, 시간적 불일치, 등) 에 기초하는 멀티-채널 시스템으로 확장될 수도 있다.
도 7 을 참조하면, 방법 (700) 의 플로우차트가 도시된다. 방법 (700) 은 도 1 의 제 2 디바이스 (106), 디코더 (118), 스테레오 파라미터 컨디셔너 (618), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (700) 은, 702 에서, 디코더에서, 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하는 단계를 포함한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낼 수도 있다. 제 1 값은 제 1 주파수 범위와 연관될 수도 있고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정될 수도 있다. 제 2 값은 제 2 주파수 범위와 연관될 수도 있고, 제 2 값은 인코더-측 윈도윙 스킴을 사용하여 결정될 수도 있다. 예를 들어, 도 6 을 참조하면, 디코더 (118) 의 디멀티플렉서 (602) 는 인코딩된 중간 신호 (102), 인코딩된 사이드 신호 (103), 및 인코딩된 스테레오 파라미터 정보 (158) 를 포함하는 비트스트림 (101) 을 수신할 수도 있다. 인코더-측 윈도윙 스킴은 제 1 오버랩 사이즈를 갖는 제 1 윈도우들을 사용할 수도 있다.
방법 (700) 은 또한, 704 에서, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하는 단계를 포함한다. 예를 들어, 도 6 을 참조하면, 중간 신호 디코더 (604) 는 인코딩된 중간 신호 (102) 를 디코딩하여 디코딩된 중간 신호 (630) 를 생성할 수도 있다.
방법 (700) 은, 706 에서, 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하는 단계를 더 포함한다. 예를 들어, 도 6 을 참조하면, 변환 유닛 (606) 은 디코딩된 중간 신호 (630) 상에서 변환 동작을 수행하여 주파수-도메인 디코딩된 중간 신호 (632) 를 생성할 수도 있다. 디코더-측 윈도윙 스킴은 제 2 오버랩 사이즈를 갖는 제 2 윈도우들을 사용할 수도 있다. 디코더-측 윈도윙 스킴과 연관된 제 2 오버랩 사이즈는 인코더-측 윈도윙 스킴과 연관된 제 1 오버랩 사이즈와는 상이하다. 예를 들어, 제 2 오버랩 사이즈는 제 1 오버랩 사이즈보다 더 작다. 부가적으로, 제 1 제로-패딩 동작들은 인코더-측 윈도윙 스킴과 연관되어 인코더 (114) 에서 수행될 수도 있고 제 2 제로-패딩 동작들은 디코더-측 윈도윙 스킴과 연관되어 디코더 (118) 에서 수행될 수도 있다.
방법 (700) 은 또한, 708 에서, 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하는 단계를 포함한다. 예를 들어, 도 6 을 참조하면, 스테레오 디코더 (616) 는 인코딩된 스테레오 파라미터 정보 (158) 를 디코딩하여 제 1 값 (151) 및 제 2 값 (155) 을 결정할 수도 있다.
방법 (700) 은, 710 에서, 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하는 단계를 더 포함한다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관될 수도 있다. 예를 들어, 도 6 을 참조하면, 스테레오 파라미터 컨디셔너 (618) 는 제 1 값 (151) 및 제 2 값 (155) 상에서 컨디셔닝 동작을 수행하여 컨디셔닝된 값 (640) 을 생성할 수도 있다.
방법 (700) 은 또한, 712 에서, 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 단계를 포함한다. 컨디셔닝된 값은 업-믹스 동작 동안 주파수-도메인 디코딩된 중간 신호에 적용될 수도 있다. 예를 들어, 도 6 을 참조하면, 업-믹서 (610) 는 주파수-도메인 디코딩된 중간 신호 (632) 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 (642) 및 제 2 주파수-도메인 출력 신호 (642) 를 생성할 수도 있다.
일 구현에 따르면, 방법 (700) 은 제 1 주파수-도메인 출력 신호 상에서 제 1 역 변환 동작을 수행하여 제 1 출력 신호를 생성하는 단계를 포함할 수도 있다. 예를 들어, 도 6 을 참조하면, 역 변환 유닛 (622) 은 제 1 주파수-도메인 출력 신호 (642) 상에서 역 변환 동작을 수행하여 제 1 출력 신호 (126) 를 생성할 수도 있다. 일 구현에 따르면, 방법 (700) 은 제 2 주파수-도메인 출력 신호 상에서 제 2 역 변환 동작을 수행하여 제 2 출력 신호를 생성하는 단계를 포함할 수도 있다. 예를 들어, 도 6 을 참조하면, 역 변환 유닛 (624) 은 제 2 주파수-도메인 출력 신호 (644) 상에서 역 변환 동작을 수행하여 제 2 출력 신호 (128) 를 생성할 수도 있다.
방법 (700) 은 또한, 714 에서, 제 1 출력 신호 및 제 2 출력 신호를 출력하는 단계를 포함한다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초할 수도 있고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초할 수도 있다. 예를 들어, 도 1 을 참조하면, 제 1 라우드스피커 (142) 는 제 1 출력 신호 (126) 를 출력할 수도 있고, 제 2 라우드스피커 (144) 는 제 2 출력 신호 (128) 를 출력할 수도 있다.
방법 (700) 은 따라서, 디코더 (118) 가 컨디셔닝된 값 (640) 에 기초하여 제 1 출력 신호 (126) 를 생성하게 할 수도 있다. 컨디셔닝된 파라미터 값 (640) 과 하나 이상의 인접한 주파수 범위들 (예를 들어, 주파수 빈들) 에 적용된 파라미터 값들 간의 차이들은 제 1 파라미터 값 (151) 과 제 2 파라미터 값 (155) 간의 차이보다 더 낮을 수도 있다. 인접한 주파수 범위들에 적용된 파라미터 값들 간의 더 낮은 차이들은 제 1 출력 신호 (126) 에서 더 적은 아티팩트들을 초래할 수도 있다.
도 8 을 참조하면, 디바이스 (예를 들어, 무선 통신 디바이스) 의 특정의 예시적 예의 블록도가 도시되고, 일반적으로 800 으로 지정된다. 다양한 구현들에서, 디바이스 (800) 는 도 8 에 예시된 것보다 더 적은 또는 더 많은 컴포넌트들을 가질 수도 있다. 예시적인 구현에서, 디바이스 (800) 는 도 1 의 제 1 디바이스 (104) 또는 제 2 디바이스 (106) 에 대응할 수도 있다. 예시적인 구현에서, 디바이스 (800) 는 도 1 내지 도 7 의 시스템들 및 방법들을 참조하여 설명된 하나 이상의 동작들을 수행할 수도 있다.
특정 구현에서, 디바이스 (800) 는 프로세서 (806)(예를 들어, 중앙 처리 장치 (CPU)) 를 포함한다. 디바이스 (800) 는 하나 이상의 추가적인 프로세서들 (810)(예를 들어, 하나 이상의 디지털 신호 프로세서 (DSP)들) 을 포함한다. 프로세서들 (810) 은 매체 (예를 들어, 스피치 및 음악) 코더-디코더 (CODEC)(808), 및 에코 소거기 (812) 를 포함할 수도 있다. 매체 CODEC (808) 은 디코더 (118), 인코더 (114), 또는 양자 모두를 포함한다.
디바이스 (800) 는 메모리 (853) 및 CODEC (834) 을 포함한다. 매체 CODEC (808) 이 프로세서들 (810) 의 컴포넌트 (예를 들어, 전용 회로부 및/또는 실행 가능한 프로그래밍 코드) 로서 예시되지만, 다른 구현들에서 매체 CODEC (808) 의 하나 이상의 컴포넌트들, 예컨대 디코더 (118), 인코더 (114), 또는 양자 모두가 프로세서 (806), CODEC (834), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다.
디바이스 (800) 는 안테나 (842) 에 커플링된 트랜시버 (811) 를 포함한다. 트랜시버 (811) 는 도 1 의 송신기 (110), 수신기 (111), 또는 양자 모두를 포함할 수도 있다. 디바이스 (800) 는 디스플레이 제어기 (826) 에 커플링된 디스플레이 (828) 를 포함한다. 하나 이상의 스피커들 (848) 이 CODEC (834) 에 커플링될 수도 있다. 하나 이상의 마이크로폰들 (846) 은, 입력 인터페이스(들)(112) 을 통해 CODEC (834) 에 커플링될 수도 있다. 특정 양태에서, 스피커들 (848) 은 도 1 의 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 또는 양자 모두를 포함할 수도 있다. 특정 구현에서, 마이크로폰들 (846) 은 도 1 의 제 1 마이크로폰 (146), 제 2 마이크로폰 (148), 또는 양자 모두를 포함할 수도 있다. CODEC (834) 은 디지털-대-아날로그 컨버터 (DAC)(802) 및 아날로그-대-디지털 컨버터 (ADC)(804) 를 포함한다.
메모리 (853) 는 도 1 내지 도 7 을 참조하여 설명된 하나 이상의 동작들을 수행하도록, 프로세서 (806), 프로세서들 (810), CODEC (834), 디바이스 (800) 의 다른 프로세싱 유닛, 또는 이들의 조합에 의해 실행 가능한 명령들 (860) 을 포함한다. 메모리 (853) 는 분석 데이터 (190) 를 저장할 수도 있다.
디바이스 (800) 의 하나 이상의 컴포넌트들은 하나 이상의 태스크들, 또는 이들의 조합을 수행하기 위한 명령들을 실행하는 프로세서에 의해 전용 하드웨어 (예를 들어, 회로부) 를 통해 구현될 수도 있다. 일 예로서, 메모리 (853) 또는 프로세서 (806), 프로세서들 (810), 및/또는 CODEC (834) 의 하나 이상의 컴포넌트들은 메모리 디바이스, 예컨대 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 트랜스퍼 MRAM (STT-MRAM), 플래시 메모리, 판독-전용 메모리 (ROM), 프로그래머블 판독-전용 메모리 (PROM), 소거 가능한 프로그래머블 판독-전용 메모리 (EPROM), 전기적으로 소거 가능한 프로그래머블 판독-전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈형 디스크, 또는 컴팩트 디스크 판독-전용 메모리 (CD-ROM) 일 수도 있다. 메모리 디바이스는, 컴퓨터 (예를 들어, CODEC (834) 내의 프로세서, 프로세서 (806), 및/또는 프로세서들 (810)) 에 의해 실행되는 경우, 컴퓨터로 하여금 도 1 내지 도 7 을 참조하여 설명된 하나 이상의 동작들을 수행하게 할 수도 있는 명령들 (예를 들어, 명령들 (860)) 을 포함할 수도 있다. 일 예로서, 메모리 (853) 또는 프로세서 (806), 프로세서들 (810), 및/또는 CODEC (834) 의 하나 이상의 컴포넌트들은, 컴퓨터 (예를 들어, CODEC (834) 의 프로세서, 프로세서 (806), 및/또는 프로세서들 (810)) 에 의해 실행되는 경우, 컴퓨터로 하여금 도 1 내지 도 7 을 참조하여 설명된 하나 이상의 동작들을 수행하게 할 수도 있는 명령들 (예를 들어, 명령들 (860)) 을 포함하는 비일시적 컴퓨터 판독가능 매체일 수도 있다.
특정 구현에서, 디바이스 (800) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (예를 들어, 이동국 모뎀 (MSM) (822)) 에 포함될 수도 있다. 특정 구현에서, 프로세서 (806), 프로세서들 (810), 디스플레이 제어기 (826), 메모리 (853), CODEC (834), 및 트랜시버 (811) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (822) 에 포함된다. 특정 구현에서, 입력 디바이스 (830), 예컨대 터치스크린 및/또는 키패드, 및 전력 공급기 (844) 는 시스템-온-칩 디바이스 (822) 에 커플링된다. 더욱이, 특정 구현에서, 도 8 에 예시된 바와 같이, 디스플레이 (828), 입력 디바이스 (830), 스피커들 (848), 마이크로폰들 (846), 안테나 (842), 및 전력 공급기 (844) 는 시스템-온-칩 디바이스 (822) 외부에 있다. 그러나, 디스플레이 (828), 입력 디바이스 (830), 스피커들 (848), 마이크로폰들 (846), 안테나 (842), 및 전력 공급기 (844) 각각은 시스템-온-칩 디바이스 (822) 의 컴포넌트, 예컨대 인터페이스 또는 제어기에 커플링될 수 있다.
디바이스 (800) 는 무선 전화기, 이동 디바이스, 이동 전화, 스마트폰, 셀룰러 폰, 랩톱 컴퓨터, 데스크톱 컴퓨터, 컴퓨터, 태블릿 컴퓨터, 셋톱 박스, 개인 휴대 정보단말 (PDA), 디스플레이 디바이스, 텔레비전, 게이밍 콘솔, 뮤직 플레이어, 라디오, 비디오 플레이어, 엔터테인먼트 유닛, 통신 디바이스, 고정 로케이션 데이터 유닛, 퍼스널 미디어 플레이어, 디지털 비디오 플레이어, 디지털 비디오 디스크 (DVD) 플레이어, 튜너, 카메라, 네비게이션 디바이스, 디코더 시스템, 인코더 시스템, 기지국, 비히클 또는 이들의 임의의 조합을 포함할 수도 있다.
특정 구현에서, 본원에 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (800) 는 디코딩 시스템 또는 장치 (예를 들어, 전자 디바이스, CODEC, 또는 그 안에 프로세서) 안에, 인코딩 시스템 또는 장치 안에, 또는 양자 모두에 통합될 수도 있다. 다른 구현들에서, 본원에 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (800) 는 무선 통신 디바이스 (예를 들어, 무선 전화기), 태블릿 컴퓨터, 데스크톱 컴퓨터, 랩톱 컴퓨터, 셋톱 박스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 텔레비전, 게임 콘솔, 네비게이션 디바이스, 통신 디바이스, 개인 휴대 정보단말 (PDA), 고정 로케이션 데이터 유닛, 퍼스널 미디어 플레이어, 기지국, 비히클 또는 디바이스의 다른 유형 안에 통합될 수도 있다.
본원에 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (800) 에 의해 수행된 다양한 기능들은 소정의 컴포넌트들 또는 모듈들에 의해 수행되는 것으로서 설명된다는 것이 주목되어야 한다. 컴포넌트들 및 모듈들의 이 분할은 단지 예시를 위한 것이다. 대안의 구현에서, 특정 컴포넌트 또는 모듈에 의해 수행된 기능은 다수의 컴포넌트들 또는 모듈들 사이에 분할될 수도 있다. 더욱이, 대안의 구현에서, 본원에 설명된 시스템들의 2 이상의 컴포넌트들 또는 모듈들은 단일의 컴포넌트 또는 모듈 안에 통합될 수도 있다. 본원에 설명된 시스템들에 예시된 각각의 컴포넌트 또는 모듈은 하드웨어 (예를 들어, 필드-프로그래머블 게이트 어레이 (FPGA) 디바이스, 주문형 집적 회로 (ASIC), DSP, 제어기 등), 소프트웨어 (예를 들어, 프로세서에 의해 실행 가능한 명령들), 또는 이들의 임의의 조합을 사용하여 구현될 수도 있다.
설명된 양태들과 연관되어, 장치는 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하기 위한 수단을 포함한다. 인코딩된 스테레오 파라미터 정보는 스테레오 파라미터의 제 1 값 및 스테레오 파라미터의 제 2 값을 나타낸다. 제 1 값은 제 1 주파수 범위와 연관되고, 제 1 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 제 2 값은 제 2 주파수 범위와 연관되고, 제 2 값은 인코더-측 윈도윙 스킴을 사용하여 결정된다. 예를 들어, 수신하기 위한 수단은 도 1 의 수신기 (111), 도 6 의 디멀티플렉서 (602), 도 8 의 트랜시버 (811), 안테나 (842), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하기 위한 수단을 포함할 수도 있다. 예를 들어, 인코딩된 중간 신호를 디코딩하기 위한 수단은 도 1 의 디코더 (118), 도 6 의 중간 신호 디코더 (630), 도 8 의 매체 CODEC (808), 프로세서들 (810), CODEC (834), 프로세서 (806), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하기 위한 수단을 포함할 수도 있다. 예를 들어, 변환 동작을 수행하기 위한 수단은 도 1 의 디코더 (118), 도 6 의 변환 유닛 (606), 도 8 의 매체 CODEC (808), 프로세서들 (810), CODEC (834), 프로세서 (806), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 인코딩된 스테레오 파라미터 정보를 디코딩하여 제 1 값 및 제 2 값을 결정하기 위한 수단을 포함할 수도 있다. 예를 들어, 인코딩된 스테레오 파라미터 정보를 디코딩하기 위한 수단은 도 1 의 디코더 (118), 도 6 의 스테레오 디코더 (616), 도 8 의 매체 CODEC (808), 프로세서들 (810), CODEC (834), 프로세서 (806), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 제 1 값 및 제 2 값 상에서 컨디셔닝 동작을 수행하여 스테레오 파라미터의 컨디셔닝된 값을 생성하기 위한 수단을 포함할 수도 있다. 컨디셔닝된 값은 제 1 주파수 범위의 서브세트 또는 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관된다. 예를 들어, 컨디셔닝 동작을 수행하기 위한 수단은 도 1 의 디코더 (118), 도 6 의 스테레오 파라미터 컨디셔너 (618), 도 8 의 매체 CODEC (808), 프로세서들 (810), CODEC (834), 프로세서 (806), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하기 위한 수단을 포함할 수도 있다. 컨디셔닝된 값은 업-믹스 동안 주파수-도메인 디코딩된 중간 신호에 적용된다. 예를 들어, 업-믹스 동작을 수행하기 위한 수단은 도 1 의 디코더 (118), 도 6 의 업-믹서 (610), 도 6 의 스테레오 프로세서 (620), 도 8 의 매체 CODEC (808), 프로세서들 (810), CODEC (834), 프로세서 (806), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
장치는 또한, 제 1 출력 신호 및 제 2 출력 신호를 출력하기 위한 수단을 포함할 수도 있다. 제 1 출력 신호는 제 1 주파수-도메인 출력 신호에 기초하고, 제 2 출력 신호는 제 2 주파수-도메인 출력 신호에 기초한다. 예를 들어, 출력하기 위한 수단은 도 1 의 라우드스피커 (142, 144), 도 8 의 스피커들 (848), 하나 이상의 다른 디바이스들, 회로들, 또는 모듈들을 포함할 수도 있다.
도 9 를 참조하면, 기지국 (900) 의 특정 예시적 예의 블록도가 도시된다. 다양한 구현들에서, 기지국 (900) 은 도 9 에 예시된 것보다 더 많은 컴포넌트들 또는 더 적은 컴포넌트들을 가질 수도 있다. 예시적인 예에서, 기지국 (900) 은 도 1 의 제 1 디바이스 (104), 제 2 디바이스 (106), 또는 양자 모두를 포함할 수도 있다. 예시적 예에서, 기지국 (900) 는 도 7 의 방법에 따라 동작할 수도 있다.
기지국 (900) 은 무선 통신 시스템의 부분일 수도 있다. 무선 통신 시스템은 다수의 기지국들 및 다수의 무선 디바이스들을 포함할 수도 있다. 무선 통신 시스템은 롱 텀 에볼루션 (LTE) 시스템, 코드 분할 다중 액세스 (CDMA) 시스템, 모바일 통신용 글로벌 시스템 (GSM) 시스템, 무선 로컬 영역 네트워크 (WLAN) 시스템, 또는 일부 다른 무선 시스템일 수도 있다. CDMA 시스템은 광대역 CDMA (WCDMA), CDMA 1X, 에볼루션-데이터 최적화 (EVDO), 시간 분할 동기식 CDMA (TD-SCDMA), 또는 CDMA 의 일부 다른 버전을 구현할 수도 있다.
무선 디바이스들은 또한, 사용자 장비 (UE), 이동국, 단말기, 액세스 단말기, 가입자 유닛, 스테이션 등으로서 지칭될 수도 있다. 무선 디바이스들은 셀룰러 폰, 스마트폰, 태블릿, 무선 모뎀, 개인 휴대 정보단말 (PDA), 핸드헬드 디바이스, 랩톱 컴퓨터, 스마트북, 넷북, 태블릿, 코드리스 폰, 무선 로컬 루프 (WLL) 스테이션, 블루투스 디바이스 등을 포함할 수도 있다. 무선 디바이스들은 도 8 의 디바이스 (800) 를 포함 또는 이에 대응할 수도 있다.
다양한 기능들은 메시지들 및 데이터 (예를 들어, 오디오 데이터) 를 전송 및 수신하는 것과 같이, 기지국 (900) 의 하나 이상의 컴포넌트들에 의해 (및/또는 도시되지 않은 다른 컴포넌트들에서) 수행될 수도 있다. 특정 예에서, 기지국 (900) 은 프로세서 (906)(예를 들어, CPU) 를 포함한다. 기지국 (900) 은 트랜스코더 (910) 를 포함할 수도 있다. 트랜스코더 (910) 는 오디오 CODEC (908)(예를 들어, 스피치 및 뮤직 CODEC) 을 포함할 수도 있다. 예를 들어, 트랜스코더 (910) 는 오디오 CODEC (908) 의 동작들을 수행하도록 구성된 하나 이상의 컴포넌트들 (예를 들어, 회로부) 을 포함할 수도 있다. 다른 예로서, 트랜스코더 (910) 는 오디오 CODEC (908) 의 동작들을 수행하기 위한 하나 이상의 컴퓨터-판독가능 명령들을 실행하도록 구성된다. 오디오 CODEC (908) 은 트랜스코더 (910) 의 컴포넌트로서 예시되지만, 다른 예들에서 오디오 CODEC (908) 의 하나 이상의 컴포넌트들은 프로세서 (906), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다. 예를 들어, 디코더 (114)(예를 들어, 보코더 디코더) 는 수신기 데이터 프로세서 (964) 에 포함될 수도 있다. 다른 예로서, 인코더 (114)(예를 들어, 보코더 인코더) 는 송신 데이터 프로세서 (982) 에 포함될 수도 있다.
트랜스코더 (910) 는 2 이상의 네트워크들 간에 메시지들 및 데이터를 트랜스코딩하도록 기능할 수도 있다. 트랜스코더 (910) 는 메시지 및 오디오 데이터를 제 1 포맷 (예를 들어, 디지털 포맷) 에서 제 2 포맷으로 컨버팅하도록 구성된다. 예시하기 위해, 디코더 (114) 는 제 1 포맷을 갖는 인코딩된 신호들을 디코딩할 수도 있고 인코더 (114) 는 디코딩된 신호들을 제 2 포맷을 갖는 인코딩된 신호들로 인코딩할 수도 있다. 부가적으로 또는 대안으로, 트랜스코더 (910) 는 데이터 레이트 적응을 수행하도록 구성된다. 예를 들어, 트랜스코더 (910) 는 오디오 데이터의 포맷을 변화시키지 않고 데이터 레이트를 다운컨버팅 또는 데이터 레이트를 업컨버팅할 수도 있다. 예시하기 위해, 트랜스코더 (910) 는 64 kbit/s 신호들을 16 kbit/s 신호들로 다운컨버팅할 수도 있다. 오디오 CODEC (908) 은 인코더 (114) 및 디코더 (114) 를 포함할 수도 있다. 디코더 (114) 는 스테레오 파라미터 컨디셔너 (618) 를 포함할 수도 있다.
기지국 (900) 은 메모리 (932) 를 포함할 수도 있다. 메모리 (932), 예컨대 컴퓨터 판독가능 저장 디바이스는 명령들을 포함할 수도 있다. 명령들은 도 7 의 방법을 수행하도록 프로세서 (906), 트랜스코더 (910), 또는 이들의 조합에 의해 실행 가능한 하나 이상의 명령들을 포함할 수도 있다. 기지국 (900) 은 안테나들의 어레이에 커플링된, 다수의 송신기들 및 수신기들 (예를 들어, 트랜시버들), 예컨대 제 1 트랜시버 (952) 및 제 2 트랜시버 (954) 를 포함할 수도 있다. 안테나들의 어레이는 제 1 안테나 (942) 및 제 2 안테나 (944) 를 포함할 수도 있다. 안테나들의 어레이는 하나 이상의 무선 디바이스들, 예컨대 도 8 의 디바이스 (800) 와 무선으로 통신하도록 구성된다. 예를 들어, 제 2 안테나 (944) 는 무선 디바이스로부터 데이터 스트림 (914)(예를 들어, 비트스트림) 을 수신할 수도 있다. 데이터 스트림 (914) 은 메시지들, 데이터 (예를 들어, 인코딩된 스피치 데이터), 또는 이들의 조합을 포함할 수도 있다.
기지국 (900) 은 네트워크 접속 (960), 예컨대 백홀 접속을 포함할 수도 있다. 네트워크 접속 (960) 은 무선 통신 네트워크의 하나 이상의 기지국들 또는 코너 네트워크와 통신하도록 구성된다. 예를 들어, 기지국 (900) 은 네트워크 접속 (960) 을 통해 코어 네트워크로부터 제 2 데이터 스트림 (예를 들어, 메시지들 또는 오디오 데이터) 을 수신할 수도 있다. 기지국 (900) 은 제 2 데이터 스트림을 프로세싱하여 메시지들 또는 오디오 데이터를 생성하고 메시지들 또는 오디오 데이터를 안테나들의 어레이의 하나 이상의 안테나들을 통해 하나 이상의 무선 디바이스로 또는 네트워크 접속 (960) 을 통해 다른 기지국에 제공할 수도 있다. 특정 구현에서, 네트워크 접속 (960) 은 예시적인, 비-제한의 예로서 광역 네트워크 (WAN) 접속일 수도 있다. 일부 구현들에서, 코어 네트워크는 공중 전화 교환망 (PSTN), 패킷 백본 네트워크, 또는 양자 모두를 포함하거나 또는 이에 대응할 수도 있다.
기지국 (900) 은 네트워크 접속 (960) 및 프로세서 (906) 에 커플링되는 매체 게이트웨이 (970) 를 포함할 수도 있다. 매체 게이트웨이 (970) 는 상이한 텔레통신 기술들의 매체 스트림들 간에 컨버팅하도록 구성된다. 예를 들어, 매체 게이트웨이 (970) 는 상이한 송신 프로토콜들, 상이한 코딩 스킴들, 또는 양자 모두 간에 컨버팅할 수도 있다. 예시하기 위해, 매체 게이트웨이 (970) 는, 예시적인 비-제한의 예로서, PCM 신호들로부터 실시간 이송 프로토콜 (RTP) 신호들로 컨버팅할 수도 있다. 매체 게이트웨이 (970) 는 패킷 교환 네트워크들 (예를 들어, VoIP (Voice Over Internet Protocol) 네트워크, IP 멀티미디어 서브시스템 (IMS), 제 4 세대 (4G) 무선 네트워크, 예컨대 LTE, WiMax, 및 UMB, 등), 회선 교환 네트워크들 (예를 들어, PSTN), 및 하이브리드 네트워크들 (예를 들어, 제 2 세대 (2G) 무선 네트워크, 예컨대 GSM, GPRS, 및 EDGE, 제 3 세대 (3G) 무선 네트워크, 예컨대 WCDMA, EV-DO, 및 HSPA, 등) 사이에서 데이터를 컨버팅할 수도 있다.
부가적으로, 매체 게이트웨이 (970) 는 트랜스코더, 예컨대 트랜스코더 (910) 를 포함할 수도 있고, 코덱들이 호환 가능한 경우 데이터를 트랜스코딩하도록 구성된다. 예를 들어, 매체 게이트웨이 (970) 는 예시적인, 비-제한의 예로서, 적응적 멀티-레이트 (AMR) 코덱과 G.711 코덱 사이에서 트랜스코딩할 수도 있다. 매체 게이트웨이 (970) 는 라우터 및 복수의 물리적 인터페이스들을 포함할 수도 있다. 일부 구현들에서, 매체 게이트웨이 (970) 는 또한, 제어기 (미도시) 를 포함할 수도 있다. 특정 구현에서, 매체 게이트웨이 제어기는 매체 게이트웨이 (970) 외부, 기지국 (900) 외부, 또는 양자 모두에 있을 수도 있다. 매체 게이트웨이 제어기는 다수의 매체 게이트웨이들의 동작들을 제어 및 코디네이트할 수도 있다. 매체 게이트웨이 (970) 는 매체 게이트웨이 제어기로부터 제어 신호들을 수신할 수도 있고 상이한 송신 기술들 간의 브리지로 기능할 수도 있으며 엔드-사용자 능력들 및 접속들에 서비스를 추가할 수도 있다.
기지국 (900) 은 트랜시버들 (952, 954), 수신기 데이터 프로세서 (964), 및 프로세서 (906) 에 커플링되는 복조기 (962) 를 포함할 수도 있고, 수신기 데이터 프로세서 (964) 는 프로세서 (906) 에 커플링될 수도 있다. 복조기 (962) 는 트랜시버들 (952, 954) 로부터 수신된 변조된 신호들을 복조하고, 복조된 데이터를 수신기 데이터 프로세서 (964) 에 제공하도록 구성된다. 수신기 데이터 프로세서 (964) 는 복조된 데이터로부터 메시지 또는 오디오 데이터를 추출하고, 메시지 또는 오디오 데이터를 프로세서 (906) 로 전송하도록 구성된다.
기지국 (900) 은 송신 데이터 프로세서 (982) 및 송신 다중 입력-다중 출력 (MIMO) 프로세서 (984) 를 포함할 수도 있다. 송신 데이터 프로세서 (982) 는 프로세서 (906) 및 송신 MIMO 프로세서 (984) 에 커플링될 수도 있다. 송신 MIMO 프로세서 (984) 는 트랜시버들 (952, 954) 및 프로세서 (906) 에 커플링될 수도 있다. 일부 구현들에서, 송신 MIMO 프로세서 (984) 는 매체 게이트웨이 (970) 에 커플링될 수도 있다. 송신 데이터 프로세서 (982) 는 프로세서 (906) 로부터 오디오 데이터 또는 메시지들을 수신하고, 예시적인 비-제한의 예들로서, CDMA 또는 직교 주파수-분할 멀티플렉싱 (OFDM) 과 같은 코딩 스킴에 기초하여 메시지들 또는 오디오 데이터를 코딩하도록 구성된다. 송신 데이터 프로세서 (982) 는 코딩된 데이터를 송신 MIMO 프로세서 (984) 에 제공할 수도 있다.
코딩된 데이터는 CDMA 또는 OFDM 기법들을 사용하여 파일롯 데이터와 같은 다른 데이터와 멀티플렉싱되어, 멀티플렉싱된 데이터를 생성할 수도 있다. 멀티플렉싱된 데이터는 그 후, 특정 변조 스킴 (예를 들어, 바이너리 위상-시프트 키잉 ("BPSK"), 쿼드러처 위상-시프트 키잉 ("QSPK"), M-ary 위상 시프트 키잉 ("M-PSK"), M-ary 쿼드러처 진폭 변조 ("M-QAM"), 등) 에 기초하여 송신 데이터 프로세서 (982) 에 의해 변조 (즉, 심볼 맵핑) 되어, 변조 심볼들을 생성할 수도 있다. 특정 구현에서, 코딩된 데이터 및 다른 데이터는 상이한 변조 스킴들을 사용하여 변조될 수도 있다. 각각의 데이터 스트림에 대한 데이터 레이트, 코딩, 및 변조는 프로세서 (906) 에 의해 실행된 명령들에 의해 결정될 수도 있다.
송신 MIMO 프로세서 (984) 는 송신 데이터 프로세서 (982) 로부터 변조 심볼들을 수신하도록 구성되고, 변조 심볼들을 더 프로세싱할 수도 있으며 데이터 상에서 빔포밍을 수행할 수도 있다. 예를 들어, 송신 MIMO 프로세서 (984) 는 변조 심볼들에 빔포밍 가중치들을 적용할 수도 있다. 빔포밍 가중치들은, 변조 심볼들이 송신되는 안테나들의 어레이 중 하나 이상의 안테나들에 대응할 수도 있다.
동작 동안, 기지국 (900) 의 제 2 안테나 (944) 는 데이터 스트림 (914) 을 수신할 수도 있다. 제 2 트랜시버 (954) 는 제 2 안테나 (944) 로부터 데이터 스트림 (914) 을 수신할 수도 있고 데이터 스트림 (914) 을 복조기 (962) 에 제공할 수도 있다. 복조기 (962) 는 데이터 스트림 (914) 의 변조된 신호들을 복조하고 복조된 데이터를 수신기 데이터 프로세서 (964) 에 제공할 수도 있다. 수신기 데이터 프로세서 (964) 는 복조된 데이터로부터 오디오 데이터를 추출하고, 추출된 오디오 데이터를 프로세서 (906) 에 제공할 수도 있다.
프로세서 (906) 는 오디오 데이터를 트랜스코딩을 위해 트랜스코더 (910) 에 제공할 수도 있다. 트랜스코더 (910) 의 디코더 (118) 는 오디오 데이터를 제 1 포맷으로부터 디코딩된 오디오 데이터로 디코딩할 수도 있고 인코더 (114) 는 디코딩된 오디오 데이터를 제 2 포맷으로 인코딩할 수도 있다. 일부 구현들에서, 인코더 (114) 는 무선 디바이스로부터 수신된 것보다 더 높은 데이터 레이트 (예를 들어, 업컨버팅) 또는 더 낮은 데이터 레이트 (예를 들어, 다운컨버팅) 를 사용하여 오디오 데이터를 인코딩할 수도 있다. 다른 구현들에서, 오디오 데이터는 트랜스코딩되지 않을 수도 있다. 트랜스코딩 (예를 들어, 디코딩 및 인코딩) 은 트랜스코더 (910) 에 의해 수행되는 것으로서 예시되지만, 트랜스코딩 동작들 (예를 들어, 디코딩 및 인코딩) 은 기지국 (900) 의 다수의 컴포넌트들에 의해 수행될 수도 있다. 예를 들어, 디코딩은 수신기 데이터 프로세서 (964) 에 의해 수행될 수도 있고 인코딩은 송신 데이터 프로세서 (982) 에 의해 수행될 수도 있다. 다른 구현들에서, 프로세서 (906) 는 다른 송신 프로토콜, 코딩 스킴, 또는 양자 모두로의 컨버전을 위해 매체 게이트웨이 (970) 에 오디오 데이터를 제공할 수도 있다. 매체 게이트웨이 (970) 는 컨버팅된 데이터를 네트워크 접속 (960) 을 통해 다른 기지국 또는 코어 네트워크에 제공할 수도 있다.
인코더 (114) 에서 생성된 인코딩된 오디오 데이터, 예컨대 트랜스코딩된 데이터는 프로세서 (906) 를 통해 송신 데이터 프로세서 (982) 또는 네트워크 접속 (960) 에 제공될 수도 있다. 트랜스코더 (910) 로부터 트랜스코딩된 오디오 데이터는 변조 스킴, 예컨대 OFDM 에 따라 코딩을 위해 송신 데이터 프로세서 (982) 에 제공되어, 변조 심볼들을 생성할 수도 있다. 송신 데이터 프로세서 (982) 는 추가의 프로세싱 및 빔포밍을 위해 변조 심볼들을 송신 MIMO 프로세서 (984) 에 제공할 수도 있다. 송신 MIMO 프로세서 (984) 는 빔포밍 가중치들을 적용할 수도 있고 변조 심볼들을 안테나들의 어레이 중 하나 이상의 안테나들, 예컨대 제 1 트랜시버 (952) 를 통해 제 1 안테나 (942) 에 제공할 수도 있다. 따라서, 기지국 (900) 은, 무선 디바이스로부터 수신된 데이터 스트림 (914) 에 대응하는 트랜스코딩된 데이터 스트림 (916) 을 다른 무선 디바이스에 제공할 수도 있다. 트랜스코딩된 데이터 스트림 (916) 은 데이터 스트림 (914) 과 상이한 인코딩 포맷, 데이터 레이트, 또는 양자 모두를 가질 수도 있다. 다른 구현들에서, 트랜스코딩된 데이터 스트림 (916) 은 다른 기지국 또는 코어 네트워크로의 송신을 위해 네트워크 접속 (960) 에 제공될 수도 있다.
당업자는 또한, 본원에 개시된 구현들과 연관되어 설명된 다양한 예시적인 논리 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 하드웨어 프로세서와 같은 프로세싱 디바이스에 의해 실행된 컴퓨터 소프트웨어, 또는 양자 모두의 조합으로서 구현될 수도 있음을 인지할 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들, 및 단계들은 그 기능에 관하여 일반적으로 전술되어 있다. 그러한 기능이 하드웨어 또는 실행 가능한 소프트웨어로서 구현되는지 여부는 특정 애플리케이션 및 전체 시스템에 부과되는 설계 제약들에 의존한다. 당업자는, 설명된 기능성을 각각의 특정 애플리케이션에 대해 다양한 방식으로 구현할 수도 있지만, 이러한 구현 결정들은 본 개시물의 범위를 벗어나게 하는 것으로 해석되지 않아야 한다.
본원에 개시된 구현들과 연관되어 설명된 방법 또는 알고리즘의 단계들은 하드웨어에서, 프로세서에 의해 실행되는 소프트웨어 모듈에서, 또는 이들 둘의 조합에서 직접적으로 구현될 수도 있다. 소프트웨어 모듈은 메모리 디바이스, 예컨대 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 트랜스퍼 MRAM (STT-MRAM), 플래시 메모리, 판독-전용 메모리 (ROM), 프로그래머블 판독-전용 메모리 (PROM), 소거 가능한 프로그래머블 판독-전용 메모리 (EPROM), 전기적으로 소거 가능한 프로그래머블 판독-전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈형 디스크, 또는 컴팩트 디스크 판독-전용 메모리 (CD-ROM) 에 있을 수도 있다. 예시적인 메모리 디바이스는, 프로세서가 메모리 디바이스로부터 정보를 판독하고, 메모리 디바이스에 정보를 기입하도록 프로세서에 커플링된다. 대안에서, 메모리 디바이스는 프로세서와 통합될 수도 있다. 프로세서 및 저장 매체는 주문형 집적 회로 (ASIC) 내에 있을 수도 있다. ASIC 는 컴퓨팅 디바이스 또는 사용자 단말 내에 있을 수도 있다. 대안에서, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에서 별개의 컴포넌트들로서 있을 수도 있다.
개시된 구현들의 이전 설명은 당업자가 개시된 구현들을 실시하거나 이용하는 것을 가능하게 하도록 제공된다. 이들 구현들에 대한 다양한 수정들이 당업자에게는 자명할 것이고, 본원에서 정의된 원리들은 본 개시물의 사상을 벗어나지 않으면서 다른 구현들에 적용될 수도 있다. 따라서, 본 개시물은 본원에서 보여진 구현들로 제한되도록 의도되지 않고, 다음의 청구항들에 의해 정의된 바와 같은 원리들과 신규의 특성들과 가능한 일치하는 최광의 범위를 따르기 위한 것이다.
Claims (30)
- 파라메트릭 오디오 디코딩을 위한 장치로서,
인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하도록 구성된 수신기로서, 상기 인코딩된 스테레오 파라미터 정보는,
제 1 주파수 범위와 연관되고 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 1 값; 및
제 2 주파수 범위와 연관되고 상기 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 2 값
을 나타내는, 상기 수신기;
상기 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하도록 구성된 중간 신호 디코더;
상기 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하도록 구성된 변환 유닛;
상기 인코딩된 스테레오 파라미터 정보를 디코딩하여 상기 제 1 값 및 상기 제 2 값을 결정하도록 구성된 스테레오 디코더;
상기 제 1 값 및 상기 제 2 값 상에서 컨디셔닝 동작을 수행하여 상기 스테레오 파라미터의 컨디셔닝된 값을 생성하도록 구성된 스테레오 파라미터 컨디셔너로서, 상기 컨디셔닝된 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관되고, 상기 스테레오 파라미터 컨디셔너는 코딩 비트레이트 임계를 충족시키는 코딩 비트레이트, 변동 임계를 충족시키는 하나 이상의 스테레오 파라미터들의 값들의 변동, 또는 이들의 조합에 기초하여 컨디셔닝 동작을 수행하는, 상기 스테레오 파라미터 컨디셔너;
상기 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하도록 구성된 업-믹서로서, 상기 컨디셔닝된 값은 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 중간 신호에 적용되는, 상기 업-믹서; 및
제 1 출력 신호 및 제 2 출력 신호를 출력하도록 구성된 출력 디바이스로서, 상기 제 1 출력 신호는 상기 제 1 주파수-도메인 출력 신호에 기초하고 상기 제 2 출력 신호는 상기 제 2 주파수-도메인 출력 신호에 기초하는, 상기 출력 디바이스를 포함하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 인코더-측 윈도윙 스킴은 제 1 오버랩 사이즈를 갖는 제 1 윈도우들을 사용하고, 상기 디코더-측 윈도윙 스킴은 제 2 오버랩 사이즈를 갖는 제 2 윈도우들을 사용하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 2 항에 있어서,
상기 제 1 오버랩 사이즈는 상기 제 2 오버랩 사이즈와 상이한, 파라메트릭 오디오 디코딩을 위한 장치. - 제 3 항에 있어서,
상기 제 2 오버랩 사이즈는 상기 제 1 오버랩 사이즈보다 더 작은, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 컨디셔닝 동작을 수행하기 위해, 상기 스테레오 파라미터 컨디셔너는 추정 함수를 상기 제 1 값 및 상기 제 2 값에 적용하도록 구성되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 5 항에 있어서,
상기 추정 함수는 평균 함수, 조정 함수, 또는 커브-피팅 함수를 포함하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 특정 주파수 범위는 상기 제 1 주파수 범위의 서브세트이고, 상기 컨디셔닝된 값은 상기 제 1 값과는 별개인, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 스테레오 파라미터 컨디셔너는 또한, 상기 컨디셔닝 동작에 기초하여 상기 스테레오 파라미터의 하나 이상의 추가적인 컨디션 값들을 생성하도록 구성되고,
상기 하나 이상의 추가적인 컨디션 값들의 각각의 컨디션 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 대응하는 주파수 범위와 연관되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 특정 주파수 범위는 상기 제 1 주파수 범위의 서브세트이고, 상기 제 1 값은 상기 제 1 주파수 범위의 다른 서브세트와 연관되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 특정 주파수 범위는 상기 제 2 주파수 범위의 서브세트이고, 상기 제 2 값은 상기 제 2 주파수 범위의 다른 서브세트와 연관되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 제 1 주파수-도메인 출력 신호 상에서 제 1 역 변환 동작을 수행하여 상기 제 1 출력 신호를 생성하도록 구성된 제 1 역 변환 유닛; 및
상기 제 2 주파수-도메인 출력 신호 상에서 제 2 역 변환 동작을 수행하여 상기 제 2 출력 신호를 생성하도록 구성된 제 2 역 변환 유닛을 더 포함하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 비트스트림은 또한, 인코딩된 사이드 신호를 포함하고,
상기 장치는,
상기 인코딩된 사이드 신호를 디코딩하여 디코딩된 사이드 신호를 생성하도록 구성된 사이드 신호 디코더; 및
상기 디코딩된 사이드 신호 상에서 제 2 변환 동작을 수행하여 주파수-도메인 디코딩된 사이드 신호를 생성하도록 구성된 제 2 변환 유닛을 더 포함하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 12 항에 있어서,
상기 컨디셔닝된 값은 또한, 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 사이드 신호에 적용되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 스테레오 파라미터 컨디셔너 및 상기 업-믹서는 이동 디바이스에 통합되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 1 항에 있어서,
상기 스테레오 파라미터 컨디셔너 및 상기 업-믹서는 기지국에 통합되는, 파라메트릭 오디오 디코딩을 위한 장치. - 파라메트릭 오디오 디코딩을 위한 방법으로서,
디코더에서, 인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하는 단계로서, 상기 인코딩된 스테레오 파라미터 정보는,
제 1 주파수 범위와 연관되고 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 1 값; 및
제 2 주파수 범위와 연관되고 상기 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 2 값
을 나타내는, 상기 비트스트림을 수신하는 단계;
상기 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하는 단계;
상기 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하는 단계;
상기 인코딩된 스테레오 파라미터 정보를 디코딩하여 상기 제 1 값 및 상기 제 2 값을 결정하는 단계;
상기 스테레오 파라미터의 컨디셔닝된 값을 생성하도록 상기 제 1 값 및 상기 제 2 값 상에서 컨디셔닝 동작을 수행하는 단계로서, 상기 컨디셔닝된 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관되고, 상기 컨디셔닝 동작은 코딩 비트레이트 임계를 충족시키는 코딩 비트레이트, 변동 임계를 충족시키는 하나 이상의 스테레오 파라미터들의 값들의 변동, 또는 이들의 조합에 기초하여 수행되는, 상기 컨디셔닝 동작을 수행하는 단계;
상기 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 단계로서, 상기 컨디셔닝된 값은 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 중간 신호에 적용되는, 상기 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 단계; 및
제 1 출력 신호 및 제 2 출력 신호를 출력하는 단계로서, 상기 제 1 출력 신호는 상기 제 1 주파수-도메인 출력 신호에 기초하고 상기 제 2 출력 신호는 상기 제 2 주파수-도메인 출력 신호에 기초하는, 상기 출력하는 단계를 포함하는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 컨디셔닝 동작을 수행하는 단계는 추정 함수를 상기 제 1 값 및 상기 제 2 값에 적용하는 단계를 포함하는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 특정 주파수 범위는 상기 제 1 주파수 범위의 서브세트이고, 상기 컨디셔닝된 값은 상기 제 1 값과는 별개인, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 컨디셔닝 동작에 기초하여 상기 스테레오 파라미터의 하나 이상의 추가적인 컨디션 값들을 생성하는 단계를 더 포함하고,
상기 하나 이상의 추가적인 컨디션 값들의 각각의 컨디션 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 대응하는 주파수 범위와 연관되는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 제 1 주파수-도메인 출력 신호 상에서 제 1 역 변환 동작을 수행하여 상기 제 1 출력 신호를 생성하는 단계; 및
상기 제 2 주파수-도메인 출력 신호 상에서 제 2 역 변환 동작을 수행하여 상기 제 2 출력 신호를 생성하는 단계를 더 포함하는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 비트스트림은 또한, 인코딩된 사이드 신호를 포함하고,
상기 방법은,
상기 인코딩된 사이드 신호를 디코딩하여 디코딩된 사이드 신호를 생성하는 단계; 및
상기 디코딩된 사이드 신호 상에서 제 2 변환 동작을 수행하여 주파수-도메인 디코딩된 사이드 신호를 생성하는 단계를 더 포함하는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 21 항에 있어서,
상기 컨디셔닝된 값은 또한, 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 사이드 신호에 적용되는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 컨디셔닝 동작 및 상기 업-믹스 동작은 이동 디바이스에서 수행되는, 파라메트릭 오디오 디코딩을 위한 방법. - 제 16 항에 있어서,
상기 컨디셔닝 동작 및 상기 업-믹스 동작은 기지국에서 수행되는, 파라메트릭 오디오 디코딩을 위한 방법. - 명령들을 포함하는 비일시적 컴퓨터 판독가능 저장 매체로서,
상기 명령들은, 디코더 내의 프로세서에 의해 실행되는 경우, 상기 프로세서로 하여금,
인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하는 것으로서, 상기 인코딩된 스테레오 파라미터 정보는,
제 1 주파수 범위와 연관되고 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 1 값; 및
제 2 주파수 범위와 연관되고 상기 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 2 값
을 나타내는, 상기 비트스트림을 수신하는 것;
상기 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하는 것;
상기 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하는 것;
상기 인코딩된 스테레오 파라미터 정보를 디코딩하여 상기 제 1 값 및 상기 제 2 값을 결정하는 것;
상기 스테레오 파라미터의 컨디셔닝된 값을 생성하도록 상기 제 1 값 및 상기 제 2 값 상에서 컨디셔닝 동작을 수행하는 것으로서, 상기 컨디셔닝된 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관되고, 상기 컨디셔닝 동작은 코딩 비트레이트 임계를 충족시키는 코딩 비트레이트, 변동 임계를 충족시키는 하나 이상의 스테레오 파라미터들의 값들의 변동, 또는 이들의 조합에 기초하여 수행되는, 상기 컨디셔닝 동작을 수행하는 것;
상기 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하여 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 것으로서, 상기 컨디셔닝된 값은 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 중간 신호에 적용되는, 상기 제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하는 것; 및
제 1 출력 신호 및 제 2 출력 신호를 출력하는 것으로서, 상기 제 1 출력 신호는 상기 제 1 주파수-도메인 출력 신호에 기초하고 상기 제 2 출력 신호는 상기 제 2 주파수-도메인 출력 신호에 기초하는, 상기 출력하는 것
을 포함하는 동작들을 수행하게 하는, 비일시적 컴퓨터 판독가능 저장 매체. - 제 25 항에 있어서,
상기 컨디셔닝 동작을 수행하는 것은 추정 함수를 상기 제 1 값 및 상기 제 2 값에 적용하는 것을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체. - 파라메트릭 오디오 디코딩을 위한 장치로서,
인코딩된 중간 신호 및 인코딩된 스테레오 파라미터 정보를 포함하는 비트스트림을 수신하기 위한 수단으로서, 상기 인코딩된 스테레오 파라미터 정보는,
제 1 주파수 범위와 연관되고 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 1 값; 및
제 2 주파수 범위와 연관되고 상기 인코더-측 윈도윙 스킴을 사용하여 결정되는, 스테레오 파라미터의 제 2 값
을 나타내는, 상기 비트스트림을 수신하기 위한 수단;
상기 인코딩된 중간 신호를 디코딩하여 디코딩된 중간 신호를 생성하기 위한 수단;
상기 디코딩된 중간 신호 상에서 변환 동작을 수행하여 디코더-측 윈도윙 스킴을 사용하여 주파수-도메인 디코딩된 중간 신호를 생성하기 위한 수단;
상기 인코딩된 스테레오 파라미터 정보를 디코딩하여 상기 제 1 값 및 상기 제 2 값을 결정하기 위한 수단;
상기 스테레오 파라미터의 컨디셔닝된 값을 생성하도록 상기 제 1 값 및 상기 제 2 값 상에서 컨디셔닝 동작을 수행하기 위한 수단으로서, 상기 컨디셔닝된 값은 상기 제 1 주파수 범위의 서브세트 또는 상기 제 2 주파수 범위의 서브세트인 특정 주파수 범위와 연관되고, 상기 컨디셔닝 동작은 코딩 비트레이트 임계를 충족시키는 코딩 비트레이트, 변동 임계를 충족시키는 하나 이상의 스테레오 파라미터들의 값들의 변동, 또는 이들의 조합에 기초하여 수행되는, 상기 컨디셔닝 동작을 수행하기 위한 수단;
제 1 주파수-도메인 출력 신호 및 제 2 주파수-도메인 출력 신호를 생성하도록 상기 주파수-도메인 디코딩된 중간 신호 상에서 업-믹스 동작을 수행하기 위한 수단으로서, 상기 컨디셔닝된 값은 상기 업-믹스 동작 동안 상기 주파수-도메인 디코딩된 중간 신호에 적용되는, 상기 업-믹스 동작을 수행하기 위한 수단; 및
제 1 출력 신호 및 제 2 출력 신호를 출력하기 위한 수단으로서, 상기 제 1 출력 신호는 상기 제 1 주파수-도메인 출력 신호에 기초하고 상기 제 2 출력 신호는 상기 제 2 주파수-도메인 출력 신호에 기초하는, 상기 출력하기 위한 수단을 포함하는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 27 항에 있어서,
상기 컨디셔닝 동작을 수행하기 위한 수단 및 상기 업-믹스 동작을 수행하기 위한 수단은 이동 디바이스에 통합되는, 파라메트릭 오디오 디코딩을 위한 장치. - 제 27 항에 있어서,
상기 컨디셔닝 동작을 수행하기 위한 수단 및 상기 업-믹스 동작을 수행하기 위한 수단은 기지국에 통합되는, 파라메트릭 오디오 디코딩을 위한 장치.
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237006383A KR20230030055A (ko) | 2016-10-13 | 2017-09-20 | 파라메트릭 오디오 디코딩 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662407843P | 2016-10-13 | 2016-10-13 | |
US62/407,843 | 2016-10-13 | ||
US15/708,717 US10362423B2 (en) | 2016-10-13 | 2017-09-19 | Parametric audio decoding |
US15/708,717 | 2017-09-19 | ||
PCT/US2017/052554 WO2018071150A1 (en) | 2016-10-13 | 2017-09-20 | Parametric audio decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237006383A Division KR20230030055A (ko) | 2016-10-13 | 2017-09-20 | 파라메트릭 오디오 디코딩 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190064584A KR20190064584A (ko) | 2019-06-10 |
KR102503904B1 true KR102503904B1 (ko) | 2023-02-24 |
Family
ID=61902837
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197009987A KR102503904B1 (ko) | 2016-10-13 | 2017-09-20 | 파라메트릭 오디오 디코딩 |
KR1020237006383A KR20230030055A (ko) | 2016-10-13 | 2017-09-20 | 파라메트릭 오디오 디코딩 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237006383A KR20230030055A (ko) | 2016-10-13 | 2017-09-20 | 파라메트릭 오디오 디코딩 |
Country Status (10)
Country | Link |
---|---|
US (5) | US10362423B2 (ko) |
EP (1) | EP3526791B1 (ko) |
JP (1) | JP6987856B2 (ko) |
KR (2) | KR102503904B1 (ko) |
CN (2) | CN109804430B (ko) |
AU (1) | AU2017342737B2 (ko) |
BR (1) | BR112019007240A2 (ko) |
ES (1) | ES2846281T3 (ko) |
TW (1) | TWI763717B (ko) |
WO (1) | WO2018071150A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE48462E1 (en) * | 2009-07-29 | 2021-03-09 | Northwestern University | Systems, methods, and apparatus for equalization preference learning |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
US11514921B2 (en) * | 2019-09-26 | 2022-11-29 | Apple Inc. | Audio return channel data loopback |
CN115277592B (zh) * | 2022-07-20 | 2023-04-11 | 哈尔滨市科佳通用机电股份有限公司 | 一种机车信号设备在信号切换时的解码方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090198356A1 (en) | 2008-02-04 | 2009-08-06 | Creative Technology Ltd | Primary-Ambient Decomposition of Stereo Audio Signals Using a Complex Similarity Index |
WO2011107951A1 (en) | 2010-03-02 | 2011-09-09 | Nokia Corporation | Method and apparatus for upmixing a two-channel audio signal |
US20150213806A1 (en) | 2012-10-05 | 2015-07-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
US20160035361A1 (en) | 2009-01-28 | 2016-02-04 | Dolby International Ab | Harmonic Transposition in an Audio Coding Method and System |
US20160189723A1 (en) | 2004-03-01 | 2016-06-30 | Dolby Laboratories Licensing Corporation | Reconstructing Audio Signals With Multiple Decorrelation Techniques |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
EP2665294A2 (en) * | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
WO2006060279A1 (en) * | 2004-11-30 | 2006-06-08 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
MX2011003824A (es) * | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2720222A1 (en) | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
BR122021009025B1 (pt) | 2013-04-05 | 2022-08-30 | Dolby International Ab | Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
US9293143B2 (en) | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
-
2017
- 2017-09-19 US US15/708,717 patent/US10362423B2/en active Active
- 2017-09-20 AU AU2017342737A patent/AU2017342737B2/en active Active
- 2017-09-20 EP EP17778087.1A patent/EP3526791B1/en active Active
- 2017-09-20 BR BR112019007240A patent/BR112019007240A2/pt unknown
- 2017-09-20 CN CN201780062070.1A patent/CN109804430B/zh active Active
- 2017-09-20 KR KR1020197009987A patent/KR102503904B1/ko active IP Right Grant
- 2017-09-20 KR KR1020237006383A patent/KR20230030055A/ko active Search and Examination
- 2017-09-20 ES ES17778087T patent/ES2846281T3/es active Active
- 2017-09-20 WO PCT/US2017/052554 patent/WO2018071150A1/en unknown
- 2017-09-20 CN CN202310511508.7A patent/CN116453528A/zh active Pending
- 2017-09-20 JP JP2019519412A patent/JP6987856B2/ja active Active
- 2017-09-25 TW TW106132782A patent/TWI763717B/zh active
-
2019
- 2019-06-11 US US16/437,518 patent/US10757521B2/en active Active
-
2020
- 2020-07-02 US US16/919,483 patent/US11102600B2/en active Active
-
2021
- 2021-08-23 US US17/409,749 patent/US11716584B2/en active Active
-
2023
- 2023-06-15 US US18/210,632 patent/US12022274B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160189723A1 (en) | 2004-03-01 | 2016-06-30 | Dolby Laboratories Licensing Corporation | Reconstructing Audio Signals With Multiple Decorrelation Techniques |
US20090198356A1 (en) | 2008-02-04 | 2009-08-06 | Creative Technology Ltd | Primary-Ambient Decomposition of Stereo Audio Signals Using a Complex Similarity Index |
US20160035361A1 (en) | 2009-01-28 | 2016-02-04 | Dolby International Ab | Harmonic Transposition in an Audio Coding Method and System |
WO2011107951A1 (en) | 2010-03-02 | 2011-09-09 | Nokia Corporation | Method and apparatus for upmixing a two-channel audio signal |
US20150213806A1 (en) | 2012-10-05 | 2015-07-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
Non-Patent Citations (3)
Title |
---|
HERRE, Jurgen, et al. MPEG-H 3D audio - the new standard for coding of immersive spatial audio. IEEE Journal of Selected Topics in Signal Processing, 2015.08 |
ISO/IEC DIS 23008-3. Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio. ISO/IEC JTC 1/SC 29/WG 11. 2014.08.05. |
Jurgen Herre, et al. MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-ChannelAudio Coding. Audio Engineering Society Convention 122, 2007.05.08., Vol.56,No.11, pp.1-23. |
Also Published As
Publication number | Publication date |
---|---|
EP3526791A1 (en) | 2019-08-21 |
EP3526791B1 (en) | 2020-10-21 |
US20240031755A1 (en) | 2024-01-25 |
US11716584B2 (en) | 2023-08-01 |
TW201816775A (zh) | 2018-05-01 |
US20210385601A1 (en) | 2021-12-09 |
US12022274B2 (en) | 2024-06-25 |
JP2019535207A (ja) | 2019-12-05 |
KR20230030055A (ko) | 2023-03-03 |
US20200336853A1 (en) | 2020-10-22 |
AU2017342737A1 (en) | 2019-03-28 |
US11102600B2 (en) | 2021-08-24 |
US20190297444A1 (en) | 2019-09-26 |
CN109804430A (zh) | 2019-05-24 |
BR112019007240A2 (pt) | 2019-07-02 |
US10757521B2 (en) | 2020-08-25 |
US20180109896A1 (en) | 2018-04-19 |
CN109804430B (zh) | 2023-05-12 |
CN116453528A (zh) | 2023-07-18 |
WO2018071150A1 (en) | 2018-04-19 |
US10362423B2 (en) | 2019-07-23 |
ES2846281T3 (es) | 2021-07-28 |
AU2017342737B2 (en) | 2022-01-20 |
KR20190064584A (ko) | 2019-06-10 |
JP6987856B2 (ja) | 2022-01-05 |
TWI763717B (zh) | 2022-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12022274B2 (en) | Parametric audio decoding | |
JP2019522233A (ja) | オーディオ信号間のチャネル間位相差の符号化および復号 | |
US20190214028A1 (en) | Stereo parameters for stereo decoding | |
US10593341B2 (en) | Coding of multiple audio signals | |
KR20230023821A (ko) | 중간 샘플링 레이트를 사용한 오디오 디코딩 | |
KR102471279B1 (ko) | 시간 도메인 채널간 대역폭 확장으로의 고대역 잔차 예측 | |
KR102581558B1 (ko) | 채널간 위상차 파라미터 수정 | |
US10210874B2 (en) | Multi channel coding | |
KR102724147B1 (ko) | 채널간 위상차 파라미터 수정 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |