KR20200040888A - 오디오 신호들의 디코딩 - Google Patents

오디오 신호들의 디코딩 Download PDF

Info

Publication number
KR20200040888A
KR20200040888A KR1020207009075A KR20207009075A KR20200040888A KR 20200040888 A KR20200040888 A KR 20200040888A KR 1020207009075 A KR1020207009075 A KR 1020207009075A KR 20207009075 A KR20207009075 A KR 20207009075A KR 20200040888 A KR20200040888 A KR 20200040888A
Authority
KR
South Korea
Prior art keywords
signal
parameter
synthesized
mid
side signal
Prior art date
Application number
KR1020207009075A
Other languages
English (en)
Other versions
KR102208842B1 (ko
Inventor
벤카타 수브라마니암 찬드라 세카르 체비얌
벤카트라만 아티
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20200040888A publication Critical patent/KR20200040888A/ko
Application granted granted Critical
Publication of KR102208842B1 publication Critical patent/KR102208842B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

디바이스는 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하도록 구성된 수신기를 포함한다. 상기 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 상기 디바이스는 또한 상기 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 디코더를 포함한다. 상기 디코더는 상기 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키도록 구성된다. 상기 디코더는 상기 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키도록 추가로 구성된다.

Description

오디오 신호들의 디코딩
I. 우선권의 주장
본 출원은 2017년 10월 5일에 출원된 동일인 소유의 미국 가특허 출원번호 제 62/568,719호, 및 2018년 9월 28일에 출원된 미국 정규 출원 번호 제 16/147,208호로부터의 우선권의 이익을 주장하며, 이의 각각의 내용들은 본원에서 그들 전체로 참조로 명확하게 포함된다.
II. 분야
본 개시물은 일반적으로 오디오 신호들의 인코딩 또는 디코딩에 관한 것이다.
III. 관련 기술의 설명
기술의 진보는 더 작고 더 강력한 컴퓨팅 디바이스들을 초래하였다. 예를 들어, 작고, 가벼우며, 사용자들이 쉽게 휴대하는 모바일 및 스마트폰들, 태블릿들 및 랩탑 컴퓨터들과 같은, 무선 전화기들을 포함한, 다양한 휴대형 개인 컴퓨팅 디바이스들이 현재 존재한다. 이들 디바이스들은 무선 네트워크들을 통해서 보이스 및 데이터 패킷들을 통신할 수 있다. 또, 다수의 이러한 디바이스들은 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 리코더, 및 오디오 파일 플레이어와 같은, 추가적인 기능을 포함한다. 또한, 이러한 디바이스들은 인터넷에 액세스하는데 사용될 수 있는, 웹 브라우저 애플리케이션과 같은, 소프트웨어 애플리케이션들을 포함한, 실행가능한 명령들을 프로세싱할 수 있다. 이와 같이, 이들 디바이스들은 상당한 컴퓨팅 능력들을 포함할 수 있다.
컴퓨팅 디바이스는 오디오 신호들을 수신하기 위한 다수의 마이크로폰들을 포함할 수도 있다. 스테레오-인코딩에서, 마이크로폰들로부터의 오디오 신호들은 미드 신호 및 하나 이상의 사이드 신호들을 발생시키는데 사용된다. 미드 신호는 제 1 오디오 신호와 제 2 오디오 신호의 총합에 대응할 수도 있다. 사이드 신호는 제 1 오디오 신호와 제 2 오디오 신호 사이의 차이에 대응할 수도 있다. 제 1 디바이스에서의 인코더는 미드 신호에 대응하는 인코딩된 미드 신호 및 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시킬 수도 있다. 인코딩된 미드 신호 및 인코딩된 사이드 신호는 제 1 디바이스로부터 제 2 디바이스로 송신될 수도 있다.
제 2 디바이스는 인코딩된 미드 신호에 대응하는 합성된 미드 신호 및 사이드 신호에 대응하는 합성된 사이드 신호를 발생시킬 수도 있다. 제 2 디바이스는 합성된 미드 신호 및 합성된 사이드 신호에 기초하여 출력 신호들을 발생시킬 수도 있다. 제 1 디바이스와 제 2 디바이스 사이의 통신 대역폭이 제한된다. 제한된 대역폭의 존재 하에서 제 2 디바이스에서 발생된 출력 신호들과 제 1 디바이스에서 수신된 오디오 신호들 사이의 차이를 감소시키는 것은 과제이다.
특정의 양태에서, 디바이스는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키도록 구성된 인코더를 포함한다. 미드 신호는 저-대역 미드 신호 및 고-대역 미드 신호를 포함한다. 인코더는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키도록 구성된다. 인코더는 저-대역 미드 신호, 고-대역 미드 신호, 및 사이드 신호에 기초하여 복수의 채널간 예측 이득 파라미터들을 발생시키도록 추가로 구성된다. 디바이스는 또한 복수의 채널간 예측 이득 파라미터들 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하도록 구성된 송신기를 포함한다.
다른 특정의 양태에서, 방법은 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 미드 신호는 저-대역 미드 신호 및 고-대역 미드 신호를 포함한다. 본 방법은 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 저-대역 미드 신호, 고-대역 미드 신호, 및 사이드 신호에 기초하여 복수의 채널간 예측 이득 파라미터들을 발생시키는 단계를 포함한다. 본 방법은 복수의 채널간 예측 이득 파라미터들 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 단계를 더 포함한다.
다른 특정의 양태에서, 장치는 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 수단을 포함한다. 미드 신호는 저-대역 미드 신호 및 고-대역 미드 신호를 포함한다. 본 장치는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 수단을 포함한다. 본 장치는 저-대역 미드 신호, 고-대역 미드 신호 및 사이드 신호에 기초하여 복수의 채널간 예측 이득 파라미터들을 발생시키는 수단을 포함한다. 본 장치는 복수의 채널간 예측 이득 파라미터들 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 수단을 더 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 미드 신호는 저-대역 미드 신호 및 고-대역 미드 신호를 포함한다. 동작들은 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 것을 포함한다. 동작들은 저-대역 미드 신호, 고-대역 미드 신호, 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 것을 포함한다. 동작들은 복수의 채널간 예측 이득 파라미터들 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 것을 더 포함한다.
다른 특정의 양태에서, 디바이스는 하나 이상의 업믹스 파라미터들, 하나 이상의 채널간 대역폭 확장 파라미터들, 하나 이상의 채널간 예측 이득 파라미터들, 및 인코딩된 오디오 신호를 수신하도록 구성된 수신기를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 디바이스는 또한 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 디코더를 포함한다. 디코더는 합성된 미드 신호 및 하나 이상의 채널간 예측 이득 파라미터들에 기초하여 합성된 사이드 신호를 발생시키도록 추가로 구성된다. 디코더는 또한 합성된 미드 신호, 합성된 사이드 신호, 하나 이상의 업믹스 파라미터들, 및 하나 이상의 채널간 대역폭 확장 파라미터들에 기초하여 하나 이상의 출력 신호들을 발생시키도록 구성된다.
다른 특정의 양태에서, 방법은 제 2 디바이스로부터 제 1 디바이스에서 하나 이상의 업믹스 파라미터들, 하나 이상의 채널간 대역폭 확장 파라미터들, 하나 이상의 채널간 예측 이득 파라미터들, 및 인코딩된 오디오 신호를 수신하는 단계를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 본 방법은 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 합성된 미드 신호 및 하나 이상의 채널간 예측 이득 파라미터들에 기초하여 합성된 사이드 신호를 발생시키는 단계를 더 포함한다. 본 방법은 또한 합성된 미드 신호, 합성된 사이드 신호, 하나 이상의 업믹스 파라미터들, 및 하나 이상의 채널간 대역폭 확장 파라미터들에 기초하여 하나 이상의 출력 신호들을 발생시키는 단계를 포함한다.
다른 특정의 양태에서, 장치는 하나 이상의 업믹스 파라미터들, 하나 이상의 채널간 대역폭 확장 파라미터들, 하나 이상의 채널간 예측 이득 파라미터들, 및 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 본 장치는 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 수단을 포함한다. 본 장치는 합성된 미드 신호 및 하나 이상의 채널간 예측 이득 파라미터들에 기초하여 합성된 사이드 신호를 발생시키는 수단을 더 포함한다. 본 장치는 합성된 미드 신호, 합성된 사이드 신호, 하나 이상의 업믹스 파라미터들, 및 하나 이상의 채널간 대역폭 확장 파라미터들에 기초하여 하나 이상의 출력 신호들을 발생시키는 수단을 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 제 2 디바이스로부터 제 1 디바이스에서 하나 이상의 업믹스 파라미터들, 하나 이상의 채널간 대역폭 확장 파라미터들, 하나 이상의 채널간 예측 이득 파라미터들, 및 인코딩된 오디오 신호를 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 동작들은 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 합성된 미드 신호 및 하나 이상의 채널간 예측 이득 파라미터들에 기초하여 합성된 사이드 신호를 발생시키는 것을 더 포함한다. 동작들은 합성된 미드 신호, 합성된 사이드 신호, 하나 이상의 업믹스 파라미터들, 및 하나 이상의 채널간 대역폭 확장 파라미터들에 기초하여 하나 이상의 출력 신호들을 발생시키는 것을 포함한다.
다른 특정의 양태에서, 디바이스는 인코더 및 송신기를 포함한다. 인코더는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키도록 구성된다. 인코더는 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키도록 구성된다. 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하도록 추가로 구성된다. 인코더는 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하도록 구성된다. 인코더는 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키도록 구성된다. 송신기는 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들을 송신하도록 구성된다.
다른 특정의 양태에서, 디바이스는 수신기 및 디코더를 포함한다. 수신기는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하도록 구성된다. 디코더는 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키도록 구성된다. 디코더는 또한 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 비트스트림 파라미터들에 기초하여 합성된 사이드 신호를 선택적으로 발생시키도록 구성된다.
다른 특정의 양태에서, 방법은 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 또한 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 단계를 더 포함한다. 본 방법은 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 단계를 포함한다. 본 방법은 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 더 포함한다. 본 방법은 또한 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스로부터, 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들의 송신을 개시하는 단계를 더 포함한다.
다른 특정의 양태에서, 방법은 디바이스에서, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 단계를 포함한다. 본 방법은 또한 디바이스에서, 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 비트스트림 파라미터들에 기초하여, 합성된 사이드 신호를 선택적으로 발생시키는 단계를 더 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 동작들은 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 것을 포함한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 것을 더 포함한다. 동작들은 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 것을 포함한다. 동작들은 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 동작들은 또한 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 비트스트림 파라미터들에 기초하여 합성된 사이드 신호를 선택적으로 발생시키는 것을 더 포함한다.
다른 특정의 양태에서, 디바이스는 인코더 및 송신기를 포함한다. 인코더는 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여 제 1 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 인코더는 또한 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키도록 구성된다. 송신기는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 송신하도록 구성된다.
다른 특정의 양태에서, 디바이스는 수신기 및 디코더를 포함한다. 수신기는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하도록 구성된다. 디코더는 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키도록 구성된다. 디코더는 또한 하나 이상의 업믹스 파라미터들을 발생시키도록 구성된다. 하나 이상의 업믹스 파라미터들 중 업믹스 파라미터는 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 것에 기초하여 제 1 값 또는 제 2 값을 갖는다. 제 1 값은 수신된 다운믹스 파라미터에 기초한다. 제 2 값은 디폴트 파라미터 값에 적어도 부분적으로 기초한다. 디코더는 적어도 합성된 미드 신호 및 하나 이상의 업믹스 파라미터들에 기초하여 출력 신호를 발생시키도록 추가로 구성된다.
다른 특정의 양태에서, 방법은 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여, 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 본 방법은 또한 디바이스에서, 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 본 방법은 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 단계를 더 포함한다. 본 방법은 또한 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스로부터, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들의 송신을 개시하는 단계를 더 포함한다.
다른 특정의 양태에서, 방법은 디바이스에서, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 단계를 포함한다. 본 방법은 또한 디바이스에서, 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스에서, 하나 이상의 업믹스 파라미터들을 발생시키는 단계를 더 포함한다. 하나 이상의 업믹스 파라미터들 중 업믹스 파라미터는 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 것에 기초하여 제 1 값 또는 제 2 값을 갖는다. 제 1 값은 수신된 다운믹스 파라미터에 기초한다. 제 2 값은 디폴트 파라미터 값에 적어도 부분적으로 기초한다. 본 방법은 또한 디바이스에서, 적어도 합성된 미드 신호 및 하나 이상의 업믹스 파라미터들에 기초하여 출력 신호를 발생시키는 단계를 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함한다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 포함한다. 동작들은 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 동작들은 또한 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 하나 이상의 업믹스 파라미터들을 발생시키는 단계를 더 포함한다. 하나 이상의 업믹스 파라미터들 중 업믹스 파라미터는 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 것에 기초하여 제 1 값 또는 제 2 값을 갖는다. 제 1 값은 수신된 다운믹스 파라미터에 기초한다. 제 2 값은 디폴트 파라미터 값에 적어도 부분적으로 기초한다. 동작들은 또한 적어도 합성된 미드 신호 및 하나 이상의 업믹스 파라미터들에 기초하여 출력 신호를 발생시키는 것을 포함한다.
다른 특정의 양태에서, 디바이스는 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하도록 구성된 수신기를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 디바이스는 또한 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 디코더를 포함한다. 디코더는 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 (intermediate) 합성된 사이드 신호를 발생시키도록 구성된다. 디코더는 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키도록 추가로 구성된다.
다른 특정의 양태에서, 방법은 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 단계를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 본 방법은 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 단계를 더 포함한다.
다른 특정의 양태에서, 장치는 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 본 장치는 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 수단을 포함한다. 본 장치는 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 수단을 포함한다. 본 장치는 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 수단을 더 포함한다.
다른 특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는 프로세서에 의해 실행될 때, 프로세서로 하여금, 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 동작들은 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 것을 더 포함한다.
본 개시물의 다른 양태들, 이점들, 및 특징들은 다음 섹션들을 포함하여 전체 출원의 검토 후, 명백하게 될 것이다. 도면들의 간단한 설명, 상세한 설명, 및 청구항들을 포함한, 출원서의 검토 후 명백하게 알 수 있을 것이다.
도 1 은 오디오 신호들을 인코딩 또는 디코딩하도록 동작가능한 시스템의 특정의 예시적인 예의 블록도이다.
도 2 는 채널간 예측 이득 파라미터에 기초하여 사이드 신호를 동기화하도록 동작가능한 시스템의 특정의 예시적인 예의 블록도이다.
도 3 은 도 2 의 시스템의 인코더의 특정의 예시적인 예의 블록도이다.
도 4 는 도 2 의 시스템의 디코더의 특정의 예시적인 예의 블록도이다.
도 5 는 도 1 의 시스템의 인코더의 일 예를 예시하는 다이어그램이다.
도 6 은 도 1 의 시스템의 인코더의 일 예를 예시하는 다이어그램이다.
도 7 은 도 1 의 시스템의 채널간 정렬기의 일 예를 예시하는 다이어그램이다.
도 8 은 도 1 의 시스템의 미드사이드 발생기의 일 예를 예시하는 다이어그램이다.
도 9 는 도 1 의 시스템의 코딩 또는 예측 선택기의 일 예를 예시하는 다이어그램이다.
도 10 은 도 1 의 시스템의 코딩 또는 예측 결정기의 일 예를 예시하는 다이어그램이다.
도 11 은 도 1 의 시스템의 업믹스 파라미터 발생기의 예들을 예시하는 다이어그램이다.
도 12 는 도 1 의 시스템의 업믹스 파라미터 발생기의 예들을 예시하는 다이어그램이다.
도 13 은 채널간 예측 이득 파라미터에 기초하여 중간 사이드 신호를 합성하고 중간 사이드 신호에 대해 필터링을 수행하여 사이드 신호를 합성하도록 동작가능한 시스템의 특정의 예시적인 예의 블록도이다.
도 14 는 도 13 의 시스템의 디코더의 제 1 예시적인 예의 블록도이다.
도 15 는 도 13 의 시스템의 디코더의 제 2 예시적인 예의 블록도이다.
도 16 은 도 13 의 시스템의 디코더의 제 3 예시적인 예의 블록도이다.
도 17 은 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 18 은 오디오 신호들을 디코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 19 는 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 20 은 오디오 신호들을 디코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 21 은 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 22 는 오디오 신호들을 디코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 23 은 오디오 신호들을 디코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 24 는 오디오 신호들을 인코딩 또는 디코딩하도록 동작가능한 디바이스의 특정의 예시적인 예의 블록도이다.
도 25 는 오디오 신호들을 인코딩 또는 디코딩하도록 동작가능한 기지국의 블록도이다.
오디오 신호들을 인코딩하도록 동작가능한 시스템들 및 디바이스들이 개시된다. 디바이스는 오디오 신호들을 인코딩하도록 구성된 인코더를 포함할 수도 있다. 오디오 신호들이 다수의 리코딩 디바이스들, 예컨대, 다수의 마이크로폰들을 이용하여, 시간적으로 동시에 캡쳐될 수도 있다. 일부 예들에서, 오디오 신호들 (또는, 다중-채널 오디오) 은 동시에 또는 상이한 시간들에서 기록되는 여러 오디오 채널들을 멀티플렉싱함으로써 합성적으로 (예컨대, 인공적으로) 발생될 수도 있다. 예시적인 예들로서, 오디오 채널들의 병행 리코딩 또는 멀티플렉싱은 2-채널 구성 (즉, 스테레오: 좌측 및 우측), 5.1 채널 구성 (좌측, 우측, 중심, 촤측 서라운드, 우측 서라운드, 및 저주파수 강조 (LFE) 채널들), 7.1 채널 구성, 7.1+4 채널 구성, 22.2 채널 구성, 또는 N-채널 구성을 초래할 수도 있다.
원격 화상 회의실들 (또는, 원거리 영상 회의실들) 에서의 오디오 캡쳐 디바이스들은 공간 오디오를 획득하는 다수의 마이크로폰들을 포함할 수도 있다. 공간 오디오는 인코딩되어 송신되는 음성 뿐만 아니라 백그라운드 오디오를 포함할 수도 있다. 주어진 소스 (예컨대, 화자) 로부터의 음성/오디오는, 마이크로폰들이 배열되는 방법 뿐만 아니라, 소스 (예컨대, 화자) 가 마이크로폰들에 대해 로케이트되는 위치 및 방 치수들에 따라서, 다수의 마이크로폰들에 상이한 시간들에서 도달할 수도 있다. 예를 들어, 사운드 소스 (예컨대, 화자) 는 디바이스와 연관된 제 2 마이크로폰 보다 디바이스와 연관된 제 1 마이크로폰에 더 가까울 수도 있다. 따라서, 사운드 소스로부터 방출된 사운드는 제 2 마이크로폰보다 시간적으로 더 빨리 제 1 마이크로폰에 도달할 수도 있다. 디바이스는 제 1 마이크로폰을 통해서 제 1 오디오 신호를 수신할 수도 있으며, 제 2 마이크로폰을 통해서 제 2 오디오 신호를 수신할 수도 있다.
오디오 신호는 세그먼트들 또는 프레임들로 인코딩될 수도 있다. 프레임은 다수의 샘플들 (예컨대, 1920 샘플들 또는 2000 샘플들) 에 대응할 수도 있다. 미드-사이드 (MS) 코딩 및 파라메트릭 스테레오 (PS) 코딩은 이중-모노 코딩 기법들보다 향상된 효율을 제공할 수도 있는 스테레오 코딩 기법들이다. 이중-모노 코딩에서, 좌측 (L) 채널 (또는, 신호) 및 우측 (R) 채널 (또는, 신호) 은 채널간 상관을 이용함이 없이 독립적으로 코딩된다. MS 코딩은 코딩 전에 좌측 채널 및 우측 채널을 합-채널 및 차이-채널 (예컨대, 사이드 채널) 로 변환함으로써, 상관된 L/R 채널-쌍 사이에 리던던시를 감소시킨다. 합 신호 및 차이 신호는 MS 코딩으로 코딩된 파형이다. 상대적으로 더 많은 비트들이 사이드 신호보다 합 신호에 소비된다. PS 코딩은 L/R 신호들을 합 신호 및 사이드 파라미터들의 세트로 변환함으로써 각각의 서브밴드에서 리던던시를 감소시킨다. 사이드 파라미터들은 채널간 강도 차이 (IID), 채널간 위상 차이 (IPD), 채널간 시간 차이 (ITD), 등을 표시할 수도 있다. 합 신호는 사이드 파라미터들과 함께 코딩되어 송신되는 파형이다. 하이브리드 시스템에서, 사이드-채널은 (예컨대, 2 킬로헤르츠 (kHz) 미만인) 하부 대역들에서 코딩되며 채널간 위상 보호가 지각적으로 덜 중요한 (예컨대, 2 kHz 이상인) 상부 대역들에서 PS 코딩되는 파형일 수도 있다.
MS 코딩 및 PS 코딩은 주파수-도메인에서 또는 서브밴드 도메인에서 이루어질 수도 있다. 일부 예들에서, 좌측 채널 및 우측 채널은 비상관될 수도 있다. 예를 들어, 좌측 채널 및 우측 채널은 비상관된 합성 신호들을 포함할 수도 있다. 좌측 채널 및 우측 채널이 비상관될 때, MS 코딩, PS 코딩, 또는 양자의 코딩 효율은 이중-모노 코딩의 코딩 효율에 근접할 수도 있다.
리코딩 구성에 따라서, 좌측 채널과 우측 채널 사이의 시간 시프트 뿐만 아니라, 에코 및 룸 (room) 반향과 같은 다른 공간 효과들이 있을 수도 있다. 채널들 사이의 시간 시프트 및 위상 부정합이 보상되지 않으면, 합 채널 및 차이 채널은 MS 또는 PS 기법들과 연관된 코딩-이득들을 감소시키는 비견할만한 에너지들을 포함할 수도 있다. 코딩-이득들에서의 감소는 시간 (또는, 위상) 시프트의 양에 기초할 수도 있다. 합 신호 및 차이 신호의 비견할만한 에너지들은 채널들이 시간적으로 시프트되지만 고도로 상관되는 어떤 프레임들에서 MS 코딩의 사용을 제한할 수도 있다. 스테레오 코딩에서, 미드 채널 (예컨대, 합 채널) 및 사이드 채널 (예컨대, 차이 채널) 은 다음 수식에 기초하여 발생될 수도 있다:
M = (L+R)/2, S = (L-R)/2, 수식 1
여기서, M 은 미드 채널에 대응하며, S 는 사이드 채널에 대응하며, L 은 좌측 채널에 대응하며, R 은 우측 채널에 대응한다.
일부의 경우, 미드 채널 및 사이드 채널은 다음 수식에 기초하여 발생될 수도 있다:
M = c (L+R), S = c (L-R), 수식 2
여기서, c 는 프레임 마다, 하나의 주파수 또는 서브밴드로부터 다른 주파수 또는 서브밴드로, 또는 이들의 조합으로 변할 수도 있는 복수소 값 또는 실수 값에 대응한다.
일부의 경우, 미드 채널 및 사이드 채널은 다음 수식에 기초하여 발생될 수도 있다:
M = (c1*L + c2*R), S = (c3*L-c4*R), 수식 3
여기서, c1, c2, c3 및 c4 는 프레임마다, 하나의 서브밴드 또는 주파수로부터 다른 서브밴드 또는 주파수까지, 또는 이들의 조합으로 변할 수도 있는 복수소 값들 또는 실수 값들이다. 수식 1, 수식 2, 또는 수식 3 에 기초하여 미드 채널 및 사이드 채널을 발생시키는 것은 "다운믹싱" 알고리즘을 수행하는 것으로서 지칭될 수도 있다. 수식 1, 수식 2, 또는 수식 3 에 기초하여 미드 채널 및 사이드 채널로부터 좌측 채널 및 우측 채널을 발생시키는 역 프로세스는 "업믹싱" 알고리즘을 수행하는 것으로서 지칭될 수도 있다.
일부의 경우, 미드 채널은 다음과 같은 다른 수식들에 기초할 수도 있다:
M = (L+gDR)/2, 또는 수식 4
M = g1L + g2R 수식 5
여기서, g1 + g2 = 1.0 이며, gD 는 이득 파라미터이다. 다른 예들에서, 다운믹스는 대역들에서 수행될 수도 있으며, 여기서, mid(b) = c1L(b) + c2R(b) 이며, c1 및 c2 는 복소수들이며, side(b) = c3L(b) - c4R(b) 이며, c3 및 c4 는 복소수들이다.
특정의 프레임에 대한 MS 코딩 또는 이중-모노 코딩 사이에 선택하는데 사용되는 애드-혹 접근법은 미드 신호 및 사이드 신호를 발생시키는 단계, 미드 신호 및 사이드 신호의 에너지들을 계산하는 단계, 및 그 에너지들에 기초하여 MS 코딩을 수행할지 여부를 결정하는 단계를 포함할 수도 있다. 예를 들어, MS 코딩은 사이드 신호 및 미드 신호의 에너지들의 비가 임계치 미만이라고 결정하는 것에 응답하여 수행될 수도 있다. 예시하기 위하여, 우측 채널이 적어도 제 1 시간 (예컨대, 약 0.001 초 또는 48 kHz에서 48 개의 샘플들) 만큼 시프트되면, (좌측 신호와 우측 신호의 총합에 대응하는) 미드 신호의 제 1 에너지는 유성음 음성 프레임들에 대한 (좌측 신호와 우측 신호 사이의 차이에 대응하는) 사이드 신호의 제 2 에너지에 필적할 수도 있다. 제 1 에너지가 제 2 에너지에 필적할 때, 사이드 채널을 인코딩하는데 더 높은 비트수가 사용될 수도 있으며, 이에 의해, 이중-모노 코딩보다 MS 코딩의 코딩 효율을 감소시킬 수도 있다. 따라서, 제 1 에너지가 제 2 에너지에 필적할 때 (예컨대, 제 1 에너지 및 제 2 에너지의 비가 임계치 이상일 때) 이중-모노 코딩이 사용될 수도 있다. 대안 접근법에서, 특정의 프레임에 대한 MS 코딩과 이중-모노 코딩 사이의 결정은 좌측 채널 및 우측 채널의 임계치와 정규화된 교차-상관 값들의 비교에 기초하여 이루어질 수도 있다.
일부 예들에서, 인코더는 제 2 오디오 신호에 대한 제 1 오디오 신호의 시간 부정합 (예컨대, 시프트) 를 표시하는 부정합 값 (예컨대, 시간 부정합 값, 이득 값, 에너지 값, 채널간 예측 값) 을 결정할 수도 있다. 시간 부정합 값 (예컨대, 부정합 값) 은 제 1 마이크로폰에서의 제 1 오디오 신호의 수신과 제 2 마이크로폰에서의 제 2 오디오 신호의 수신사이의 시간 지연의 양에 대응할 수도 있다. 더욱이, 인코더는 프레임 단위로, 예컨대, 각각의 20 밀리초 (ms) 음성/오디오 프레임에 기초하여, 시간 부정합 값을 결정할 수도 있다. 예를 들어, 시간 부정합 값은 제 2 오디오 신호의 제 2 프레임이 제 1 오디오 신호의 제 1 프레임에 대해 지연되는 시간의 양에 대응할 수도 있다. 대안적으로, 시간 부정합 값은 제 1 오디오 신호의 제 1 프레임이 제 2 오디오 신호의 제 2 프레임에 대해 지연되는 시간의 양에 대응할 수도 있다.
사운드 소스가 제 2 마이크로폰보다 제 1 마이크로폰에 더 가까울 때, 제 2 오디오 신호의 프레임들은 제 1 오디오 신호의 프레임들에 대해 지연될 수도 있다. 이 경우, 제 1 오디오 신호는 "참조 오디오 신호" 또는 "참조 채널" 로서 지칭될 수도 있으며, 지연된 제 2 오디오 신호는 "목표 오디오 신호" 또는 "목표 채널" 로서 지칭될 수도 있다. 대안적으로, 사운드 소스가 제 1 마이크로폰보다 제 2 마이크로폰에 더 가까울 때, 제 1 오디오 신호의 프레임들은 제 2 오디오 신호의 프레임들에 대해 지연될 수도 있다. 이 경우, 제 2 오디오 신호는 참조 오디오 신호 또는 참조 채널로서 지칭될 수도 있으며, 지연된 제 1 오디오 신호는 목표 오디오 신호 또는 목표 채널로서 지칭될 수도 있다.
사운드 소스들 (예컨대, 화자들) 이 회의 또는 원거리 영상회의 실에 로케이트되는 위치 또는 사운드 소스 (예컨대, 화자) 위치가 마이크로폰들에 대해 어떻게 변하는지에 따라서, 참조 채널 및 목표 채널은 프레임 마다 변할 수도 있으며; 유사하게, 시간 부정합 (예컨대, 시프트) 값이 또한 프레임 마다 변할 수도 있다. 그러나, 일부 구현예들에서, 시간 부정합 값은 "참조" 채널에 대한 "목표" 채널의 지연의 양을 표시하기 위해 항상 양일 수도 있다. 더욱이, 시간 부정합 값은 목표 채널이 "참조" 채널과 정렬되도록 (예컨대, 최대로 정렬되도록) 그 지연된 목표 채널이 시간적으로 "풀 백 (pull back) 되는" "비-인과적 시프트" 값에 대응할 수도 있다. 목표 채널을 "풀백하는 것" 은 시간에서 목표 채널을 전진시키는 것에 대응한다. "비-인과적 시프트" 는 지연된 오디오 채널을 선행 오디오 채널과 시간적으로 정렬하기 위해 선행 오디오 채널에 대한 지연된 오디오 채널 (예컨대, 지체된 오디오 채널) 의 시프트에 대응할 수도 있다. 미드 채널 및 사이드 채널을 결정하는 다운믹스 알고리즘은 참조 채널 및 비-인과적 시프트된 목표 채널에 대해 수행될 수도 있다.
인코더는 제 1 오디오 채널 및 제 2 오디오 채널에 적용된 복수의 시간 부정합 값들에 기초하여 시간 부정합 값을 결정할 수도 있다. 예를 들어, 제 1 오디오 채널의 제 1 프레임 X 는, 제 1 시간 (m1) 에서 수신될 수도 있다. 제 2 오디오 채널의 제 1 특정의 프레임 Y 는, 제 1 시간 부정합 값, 예컨대, shift1 = n1 - m1 에 대응하는 제 2 시간 (n1) 에서 수신될 수도 있다. 또, 제 1 오디오 채널의 제 2 프레임은 제 3 시간 (m2) 에서 수신될 수도 있다. 제 2 오디오 채널의 제 2 특정의 프레임은 제 2 시간 부정합 값, 예컨대, shift2 = n2 - m2 에 대응하는 제 4 시간 (n2) 에서 수신될 수도 있다.
디바이스는 프레이밍 또는 버퍼링 알고리즘을 수행하여, 제 1 샘플링 레이트 (예컨대, 32 kHz 샘플링 레이트 (즉, 프레임 당 640 개의 샘플들)) 에서 프레임 (예컨대, 20 ms 샘플들) 을 발생시킬 수도 있다. 인코더는 제 1 오디오 신호의 제 1 프레임 및 제 2 오디오 신호의 제 2 프레임이 디바이스에 동시에 도달한다고 결정하는 것에 응답하여, 시간 부정합 값 (예컨대, shift1) 을 제로 샘플들과 동일한 것으로서 추정할 수도 있다. (예컨대, 제 1 오디오 신호에 대응하는) 좌측 채널 및 (예컨대, 제 2 오디오 신호에 대응하는) 우측 채널은 시간적으로 정렬될 수도 있다. 일부의 경우, 좌측 채널 및 우측 채널은, 심지어 정렬될 때에도, 다양한 이유들 (예컨대, 마이크로폰 교정) 로 인해 에너지가 상이할 수도 있다.
일부 예들에서, 좌측 채널 및 우측 채널은 다양한 이유들로 인해 시간적으로 부정합될 (예컨대, 정렬되지 않을) 수도 있다 (예컨대, 화자와 같은, 사운드 소스는 마이크로폰들 중 하나에, 다른 하나 보다 더 가까울 수도 있으며 2개의 마이크로폰들은 임계치 (예컨대, 1-20 센티미터) 거리 보다 크게 떨어져 있을 수도 있다). 마이크로폰들에 대한 사운드 소스의 로케이션은 좌측 채널 및 우측 채널에 상이한 지연들을 도입할 수도 있다. 게다가, 좌측 채널과 우측 채널 사이에, 이득 차이, 에너지 차이, 또는 레벨 차이가 있을 수도 있다.
일부 예들에서, 다수의 사운드 소스들 (예컨대, 화자들) 로부터 마이크로폰들에서의 오디오 신호들의 도달 시간은 다수의 화자들이 (예컨대, 중첩 없이) 교대로 대화중일 때 변할 수도 있다. 이러한 경우, 인코더는 참조 채널을 식별하기 위해 화자에 기초하여 시간 부정합 값을 동적으로 조정할 수도 있다. 어떤 다른 예들에서, 다수의 화자들이 동시에 대화할 수도 있으며, 이는 가장 시끄러운 화자인 사람, 마이크로폰에 가장 가까운 사람, 등에 따라서 다양한 시간 부정합 값들을 초래할 수도 있다.
일부 예들에서, 제 1 오디오 신호 및 제 2 오디오 신호는 2개의 신호들이 더 적은 (예컨대, 전무한) 상관을 잠재적으로 보일 때에 합성되거나 또는 인공적으로 발생될 수도 있다. 본원에서 설명되는 예들은 예시적이고, 유사한 또는 상이한 상황들에서 제 1 오디오 신호와 제 2 오디오 신호 사이의 관계를 결정할 때에 유익할 수도 있는 것으로 이해되어야 한다.
인코더는 제 1 오디오 신호의 제 1 프레임과 제 2 오디오 신호의 복수의 프레임들의 비교에 기초하여 비교 값들 (예컨대, 차이 값들 또는 교차-상관 값들) 을 발생시킬 수도 있다. 복수의 프레임들의 각각의 프레임은 특정의 시간 부정합 값에 대응할 수도 있다. 인코더는 비교 값들에 기초하여 제 1 추정된 시간 부정합 값 (예컨대, 제 1 추정된 부정합 값) 을 발생시킬 수도 있다. 예를 들어, 제 1 추정된 시간 부정합 값은 제 1 오디오 신호의 제 1 프레임과 대응하는 제 2 오디오 신호의 제 1 프레임 사이에 더 높은 시간-유사도 (또는, 더 낮은 차이) 를 표시하는 비교 값에 대응할 수도 있다. 양의 시간 부정합 값 (예컨대, 제 1 추정된 시간 부정합 값) 은 제 1 오디오 신호가 선행하는 오디오 신호 (예컨대, 시간적으로 선행하는 오디오 신호) 이고 제 2 오디오 신호가 지체된 오디오 신호 (예컨대, 시간적으로 지체된 오디오 신호) 임을 표시할 수도 있다. 지체된 오디오 신호의 프레임 (예컨대, 샘플들) 은 선행하는 오디오 신호의 프레임 (예컨대, 샘플들) 에 대해 시간적으로 지연될 수도 있다.
인코더는 일련의 추정된 시간 부정합 값들을 다수의 단계들로 정제함으로써, 최종 시간 부정합 값 (예컨대, 최종 부정합 값) 을 결정할 수도 있다. 예를 들어, 인코더는 제 1 오디오 신호 및 제 2 오디오 신호의 스테레오 사전 프로세싱된 및 리샘플링된 버전들로부터 발생된 비교 값들에 기초하여 "임시" 시간 부정합 값을 먼저 추정할 수도 있다. 인코더는 추정된 "임시" 시간 부정합 값에 가장 가까운 시간 부정합 값들과 연관된 내삽된 비교 값들을 발생시킬 수도 있다. 인코더는 내삽된 비교 값들에 기초하여, 제 2 추정된 "내삽된" 시간 부정합 값을 결정할 수도 있다. 예를 들어, 제 2 추정된 "내삽된" 시간 부정합 값은 나머지 내삽된 비교 값들 및 제 1 추정된 "임시" 시간 부정합 값보다 더 높은 시간-유사도 (또는, 더 낮은 차이) 를 표시하는 특정의 내삽된 비교 값에 대응할 수도 있다. 현재의 프레임 (예컨대, 제 1 오디오 신호의 제 1 프레임) 의 제 2 추정된 "내삽된" 시간 부정합 값이 이전 프레임 (예컨대, 제 1 프레임에 선행하는 제 1 오디오 신호의 프레임) 의 최종 시간 부정합 값과 상이하면, 현재의 프레임의 "내삽된" 시간 부정합 값은 제 1 오디오 신호와 시프트된 제 2 오디오 신호 사이의 시간-유사도를 향상시키기 위해 추가로 "수정된다". 특히, 제 3 추정된 "수정된" 시간 부정합 값은 현재의 프레임의 제 2 추정된 "내삽된" 시간 부정합 값 및 이전 프레임의 최종 추정된 시간 부정합 값 주위를 탐색함으로써, 더 정확한 시간-유사도의 측정치에 대응할 수도 있다. 제 3 추정된 "수정된" 시간 부정합 값은 프레임들 사이의 시간 부정합 값에서의 임의의 거짓된 (스퓨리어스) 변화들을 제한함으로써 최종 시간 부정합 값을 추정하도록 추가로 컨디셔닝될 수도 있으며, 본원에서 설명하는 바와 같이 2개의 연속적인 (또는, 연속된) 프레임들에서 음의 시간 부정합 값을 양의 시간 부정합 값으로 (또는, 반대의 경우도 마찬가지이다) 스위칭하지 않도록 추가로 제어된다.
일부 예들에서, 인코더는 연속된 프레임들에서 또는 인접 프레임들에서 양의 시간 부정합 값과 음의 시간 부정합 값 사이에 또는 그 반대로도 스위칭하는 것을 억제할 수도 있다. 예를 들어, 인코더는 제 1 프레임의 추정된 "내삽된" 또는 "수정된" 시간 부정합 값, 및 제 1 프레임에 선행하는 특정의 프레임에서의 대응하는 추정된 "내삽된" 또는 "수정된" 또는 최종 시간 부정합 값에 기초하여, 최종 시간 부정합 값을, 시간-시프트 없음을 표시하는 특정의 값 (예컨대, 0) 으로 설정할 수도 있다. 예시하기 위하여, 인코더는 현재의 프레임의 추정된 "임시" 또는 "내삽된" 또는 "수정된" 시간 부정합 값 중 하나가 양이고 이전 프레임 (예컨대, 제 1 프레임에 선행하는 프레임) 의 추정된 "임시" 또는 "내삽된" 또는 "수정된" 또는 "최종" 추정된 시간 부정합 값 중 다른 하나가 음이라고 결정하는 것에 응답하여, 현재의 프레임 (예컨대, 제 1 프레임) 의 최종 시간 부정합 값을, 시간-시프트 없음, 즉, shift1 = 0 을 표시하도록, 설정할 수도 있다. 대안적으로, 인코더는 또한 현재의 프레임의 추정된 "임시" 또는 "내삽된" 또는 "수정된" 시간 부정합 값 중 하나가 음이고 이전 프레임 (예컨대, 제 1 프레임에 선행하는 프레임) 의 추정된 "임시" 또는 "내삽된" 또는 "수정된" 또는 "최종" 추정된 시간 부정합 값 중 다른 하나가 양이라고 결정하는 것에 응답하여, 현재의 프레임 (예컨대, 제 1 프레임) 의 최종 시간 부정합 값을, 시간-시프트 없음, 즉, shift1 = 0 을 표시하도록 설정할 수도 있다. 본원에서 인용될 때, "시간-시프트" 는 시간-시프트, 시간-오프셋, 샘플 시프트, 샘플 오프셋, 또는 오프셋에 대응할 수도 있다.
인코더는 시간 부정합 값에 기초하여, 제 1 오디오 신호 또는 제 2 오디오 신호의 프레임을 "참조" 또는 "목표" 로서 선택할 수도 있다. 예를 들어, 최종 시간 부정합 값이 양이라고 결정하는 것에 응답하여, 인코더는 제 1 오디오 신호가 "참조" 신호라는 것 그리고 제 2 오디오 신호가 "목표" 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖는 참조 채널 또는 신호 표시자를 발생시킬 수도 있다. 대안적으로, 최종 시간 부정합 값이 음이라고 결정하는 것에 응답하여, 인코더는 제 2 오디오 신호가 "참조" 신호라는 것 및 제 1 오디오 신호가 "목표" 신호라는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖는 참조 채널 또는 신호 표시자를 발생시킬 수도 있다.
참조 신호는 선두 신호에 대응할 수도 있으며, 반면 목표 신호는 지체된 신호에 대응할 수도 있다. 특정의 양태에서, 참조 신호는 제 1 추정된 시간 부정합 값에 의해 선두 신호로서 표시되는 동일한 신호일 수도 있다. 대안적인 양태에서, 참조 신호는 제 1 추정된 시간 부정합 값에 의해 선두 신호로서 표시되는 신호와 상이할 수도 있다. 참조 신호는 참조 신호가 선두 신호에 대응한다는 것을 제 1 추정된 시간 부정합 값이 표시하는지 여부와 무관하게 선두 신호로서 취급될 수도 있다. 예를 들어, 참조 신호는 다른 신호 (예컨대, 목표 신호) 를 참조 신호에 대해 시프트시킴으로써 (예컨대, 조정함으로써) 선두 신호로서 취급될 수도 있다.
일부 예들에서, 인코더는 인코딩될 프레임에 대응하는 부정합 값 (예컨대, 추정된 시간 부정합 값 또는 최종 시간 부정합 값) 및 이전에 인코딩된 프레임들에 대응하는 부정합 (예컨대, 시프트) 값들에 기초하여, 목표 신호 또는 참조 신호 중 적어도 하나를 식별하거나 또는 결정할 수도 있다. 인코더는 부정합 값들을 메모리에 저장할 수도 있다. 목표 채널은 2개의 오디오 채널들의 시간적으로 지체된 오디오 채널에 대응할 수도 있으며, 참조 채널은 2개의 오디오 채널들의 시간적으로 선행하는 오디오 채널에 대응할 수도 있다. 일부 예들에서, 인코더는 시간적으로 지체된 채널을 식별할 수도 있으며, 메모리로부터의 부정합 값들에 기초하여, 목표 채널을 참조 채널과 최대로 정렬하지 않을 수도 있다. 예를 들어, 인코더는 하나 이상의 부정합 값들에 기초하여 목표 채널을 참조 채널과 부분적으로 정렬할 수도 있다. 일부 다른 예들에서, 인코더는 전체 부정합 값 (예컨대, 100 샘플들) 을 더 작은 부정합 값들 (예컨대, 25 샘플들, 25 샘플들, 25 샘플들, 및 25 샘플들) 로 인코딩된 다수의 프레임들 (예컨대, 4개의 프레임들) 에 걸쳐서 "비-인과적으로" 분산시킴으로써, 일련의 프레임들에 걸쳐서 목표 채널을 점진적으로 조정할 수도 있다.
인코더는 참조 신호 및 비-인과적 시프트된 목표 신호와 연관된 상대 이득 (예컨대, 상대 이득 파라미터) 을 추정할 수도 있다. 예를 들어, 최종 시간 부정합 값이 양이라고 결정하는 것에 응답하여, 인코더는 비-인과적 시간 부정합 값 (예컨대, 최종 시간 부정합 값의 절대값) 만큼 오프셋된 제 2 오디오 신호에 대해 제 1 오디오 신호의 에너지 또는 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 대안적으로, 최종 시간 부정합 값이 음이라고 결정하는 것에 응답하여, 인코더는 제 2 오디오 신호에 대한 비-인과적 시프트된 제 1 오디오 신호의 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 일부 예들에서, 인코더는 비-인과적 시프트된 "목표" 신호에 대한 "참조" 신호의 에너지 또는 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 다른 예들에서, 인코더는 목표 신호 (예컨대, 비시프트된 목표 신호) 에 대한 참조 신호에 기초하여 이득 값 (예컨대, 상대 이득 값) 을 추정할 수도 있다.
인코더는 참조 신호, 목표 신호 (예컨대, 시프트된 목표 신호 또는 비시프트된 목표 신호), 비-인과적 시간 부정합 값, 및 상대 이득 파라미터에 기초하여, 적어도 하나의 인코딩된 신호 (예컨대, 미드 신호, 사이드 신호, 또는 양자) 를 발생시킬 수도 있다. 사이드 신호는 제 1 오디오 신호의 제 1 프레임의 제 1 샘플들과, 제 2 오디오 신호의 선택된 프레임의 선택된 샘플들 사이의 차이에 대응할 수도 있다. 인코더는 최종 시간 부정합 값에 기초하여, 선택된 프레임을 선택할 수도 있다. 디바이스에 의해 제 1 프레임과 동시에 수신된 제 2 오디오 신호의 프레임에 대응하는 제 2 오디오 신호의 다른 샘플들과 비교하여, 제 1 샘플들과 선택된 샘플들 사이의 감소된 차이 때문에, 사이드 신호를 인코딩하는데 더 적은 비트들이 사용될 수도 있다. 디바이스의 송신기는 적어도 하나의 인코딩된 신호, 비-인과적 시간 부정합 값, 상대 이득 파라미터, 참조 채널 또는 신호 표시자, 또는 이들의 조합을 송신할 수도 있다.
인코더는 참조 신호, 목표 신호 (예컨대, 시프트된 목표 신호 또는 비시프트된 목표 신호), 비-인과적 시간 부정합 값, 상대 이득 파라미터, 제 1 오디오 신호의 특정의 프레임의 저 대역 파라미터들, 특정의 프레임의 고 대역 파라미터들, 또는 이들의 조합에 기초하여, 적어도 하나의 인코딩된 신호 (예컨대, 미드 신호, 사이드 신호, 또는 양자) 를 발생시킬 수도 있다. 특정의 프레임은 제 1 프레임보다 선행할 수도 있다. 하나 이상의 선행하는 프레임들로부터의, 어떤 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합이 제 1 프레임의, 미드 신호, 사이드 신호, 또는 양자를 인코딩하는데 사용될 수도 있다. 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합에 기초하여, 미드 신호, 사이드 신호, 또는 양자를 인코딩하는 것은 비-인과적 시간 부정합 값 및 채널간 상대 이득 파라미터의 추정들을 향상시킬 수도 있다. 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합은 피치 파라미터, 보이싱 파라미터, 코더 유형 파라미터, 저-대역 에너지 파라미터, 고-대역 에너지 파라미터, 기울기 파라미터, 피치 이득 파라미터, FCB 이득 파라미터, 코딩 모드 파라미터, 보이스 활성도 파라미터, 잡음 추정 파라미터, 신호-대-잡음비 파라미터, 포르만츠 파라미터, 음성/음악 결정 파라미터, 비-인과적 시프트, 채널간 이득 파라미터, 또는 이들의 조합을 포함할 수도 있다. 디바이스의 송신기는 적어도 하나의 인코딩된 신호, 비-인과적 시간 부정합 값, 상대 이득 파라미터, 참조 채널 (또는, 신호) 표시자, 또는 이들의 조합을 송신할 수도 있다. 본원에서 인용될 때, 오디오 "신호" 은 오디오 "채널" 에 대응한다. 본원에서 인용될 때, "시간 부정합 값" 은 오프셋 값, 부정합 값, 시간-오프셋 값, 샘플 시간 부정합 값, 또는 샘플 오프셋 값에 대응한다. 본원에서 인용될 때, 목표 신호를 "시프트시키는 것" 은 목표 신호를 나타내는 데이터의 로케이션(들) 을 시프트시키는 것, 데이터를 하나 이상의 메모리 버퍼들에 복사하는 것, 목표 신호와 연관된 하나 이상의 메모리 포인터들을 이동시키는 것, 또는 이들의 조합을 이동시키는 것에 대응할 수도 있다.
본 개시물의 특정의 양태들이 도면들을 참조하여 아래에서 설명된다. 이 설명에서, 공통 특징들은 공통 참조 번호들에 의해 지정된다. 본원에서 사용될 때, 여러 전문용어는 단지 특정의 구현예들을 기술하려는 목적을 위해 사용되며 구현예들을 한정하려고 의도되지 않는다. 예를 들어, 단수형들 "한 (a)", "하나 (an)", 및 "그 (the)" 는 문맥에서 달리 분명히 표시하지 않는 한, 복수형들도 또한 포함시키려는 것이다. 또한, 용어들 "포함한다 (comprise)" 및 "포함한다 (comprises)" 는 "구비한다 (include)", "구비한다 (includes)", 또는 "구비하는 (including)" 과 상호교환가능하게 사용될 수도 있음을 알 수 있을 것이다. 추가적으로, 용어 "여기서 (wherein)" 는 "이때 (where)" 와 상호교환가능하게 사용될 수도 있음을 알 수 있을 것이다. 본원에서 사용될 때, "예시적인" 은 예, 구현예, 및/또는 양태를 표시할 수도 있으며, 한정하거나 또는 선호사항 또는 바람직한 구현예를 표시하는 것으로 해석되어서는 안된다. 본원에서 사용될 때, 구조, 컴포넌트, 동작, 등과 같은 엘리먼트를 한정하는데 사용되는 서수의 용어 (예컨대, "제 1", "제 2", "제 3", 등) 는 다른 엘리먼트에 대해서 그 엘리먼트의 임의의 우선순위 또는 순서를 단독으로 표시하기 보다는, 오히려 그 엘리먼트를 (서수의 용어를 사용하지 않는다면) 동일한 이름을 가지는 다른 엘리먼트와 단순히 식별한다. 본원에서 사용될 때, 용어 "세트" 는 하나 이상의 특정의 엘리먼트를 지칭하며, 용어 "복수" 는 다수의 (예컨대, 2개 이상의) 특정의 엘리먼트를 지칭한다.
본 개시물에서, 용어들 예컨대, "결정하는 것", "계산하는 것", "추정하는 것", "시프팅하는 것", "조정하는 것", 등은 하나 이상의 동작들이 수행되는 방법을 설명하기 위해 사용될 수도 있다. 이러한 용어들이 한정하는 것으로 해석되어서는 안되며 다른 기법들이 유사한 동작들을 수행하기 위해 이용될 수도 있다는 점에 유의해야 한다. 추가적으로, 본원에서 인용될 때, "발생시키는 것", "계산하는 것", "추정하는 것", "이용하는 것", "선택하는 것", "액세스하는 것", 및 "결정하는 것" 은 교환가능하게 사용될 수도 있다. 예를 들어, 파라미터 (또는, 신호) 를 "발생시키는 것", "계산하는 것", "추정하는 것", 또는 "결정하는 것" 은 파라미터 (또는, 신호) 를 능동적으로 발생시키거나, 추정하거나, 계산하거나, 또는 결정하는 것을 지칭할 수도 있거나, 또는 예컨대, 다른 컴포넌트 또는 디바이스에 의해 이미 발생된 파라미터 (또는, 신호) 를 이용하거나, 선택하거나, 또는 이에 액세스하는 것을 지칭할 수도 있다.
도 1 을 참조하면, 시스템의 특정의 예시적인 예가 개시되며 일반적으로 100 으로 지정된다. 시스템 (100) 은 네트워크 (120) 를 통해서 제 2 디바이스 (106) 에 통신가능하게 커플링된 제 1 디바이스 (104) 를 포함한다. 네트워크 (120) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다.
제 1 디바이스 (104) 는 인코더 (114), 송신기 (110), 하나 이상의 입력 인터페이스(들) (112), 또는 이들의 조합을 포함할 수도 있다. 입력 인터페이스들 (112) 의 제 1 입력 인터페이스는 제 1 마이크로폰 (146) 에 커플링될 수도 있다. 입력 인터페이스(들) (112) 의 제 2 입력 인터페이스는 제 2 마이크로폰 (147) 에 커플링될 수도 있다. 인코더 (114) 는 본원에서 설명하는 바와 같이, 오디오 신호들을 다운믹싱하여 인코딩하도록 구성될 수도 있다. 인코더 (114) 는 코딩 또는 예측 (CP) 선택기 (122) 에, 그리고, 미드사이드 발생기 (gen) (148) 에 커플링된 채널간 정렬기 (108) 를 포함한다. 인코더 (114) 는 또한 CP 선택기 (122) 에, 그리고, 미드사이드 발생기 (148) 에 커플링된 신호 발생기 (116) 를 포함한다. 특정의 양태에서, 채널간 정렬기 (108) 는 "시간 등화기" 로서 지칭될 수도 있다.
제 2 디바이스 (106) 는 디코더 (118) 를 포함할 수도 있다. 디코더 (118) 는 업믹스 파라미터 (param) 발생기 (176) 에, 그리고 신호 발생기 (174) 에 커플링된 CP 결정기 (172) 를 포함할 수도 있다. 신호 발생기 (174) 는 오디오 신호들을 업믹싱 및 렌더링하도록 구성된다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 또는 양자에 커플링될 수도 있다.
동작 동안, 제 1 디바이스 (104) 는 제 1 마이크로폰 (146) 으로부터 제 1 입력 인터페이스를 통해서 제 1 오디오 신호 (130) 를 수신할 수도 있으며, 제 2 마이크로폰 (147) 으로부터 제 2 입력 인터페이스를 통해서 제 2 오디오 신호 (132) 를 수신할 수도 있다. 제 1 오디오 신호 (130) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (132) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다. 제 1 마이크로폰 (146) 및 제 2 마이크로폰 (147) 은 사운드 소스 (152) (예컨대, 사용자, 스피커, 주변 잡음, 악기, 등) 로부터 오디오를 수신할 수도 있다. 특정의 양태에서, 제 1 마이크로폰 (146), 제 2 마이크로폰 (147), 또는 양자는 다수의 사운드 소스들로부터 오디오를 수신할 수도 있다. 다수의 사운드 소스들은 지배적인 (또는, 대부분의 지배적인) 사운드 소스 (예컨대, 사운드 소스 (152)) 및 하나 이상의 2차 사운드 소스들을 포함할 수도 있다. 하나 이상의 2차 사운드 소스들은 트래픽, 백그라운드 음악, 다른 화자, 거리 잡음, 등에 대응할 수도 있다. 사운드 소스 (152) (예컨대, 지배적인 사운드 소스) 는 제 2 마이크로폰 (147) 보다 제 1 마이크로폰 (146) 에 더 가까울 수도 있다. 따라서, 사운드 소스 (152) 로부터의 오디오 신호가 제 2 마이크로폰 (147) 을 통한 것 보다 더 빠른 시간에 제 1 마이크로폰 (146) 을 통해서 입력 인터페이스(들) (112) 에서 수신될 수도 있다. 다수의 마이크로폰들을 통한 멀티-채널 신호 획득에서의 이러한 자연스러운 지연은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이에 시간 부정합을 도입할 수도 있다.
채널간 정렬기 (108) 는 도 7 을 참조하여 추가로 설명되는 바와 같이, 제 2 오디오 신호 (132) (예컨대, "참조") 에 대한 제 1 오디오 신호 (130) (예컨대, "목표") 의 시간 부정합 (예컨대, 비-인과적 시프트) 을 표시하는 시간 부정합 값을 결정할 수도 있다. 시간 부정합 값은 제 1 오디오 신호 (130) 의 제 1 프레임의 제 1 샘플들과 제 2 오디오 신호 (132) 의 제 2 프레임의 제 2 샘플들 사이의 시간 부정합 (예컨대, 시간 지연) 의 양을 표시할 수도 있다. 본원에서 인용될 때, "시간 지연" 은 "시간 지연" 에 대응할 수도 있다. 시간 부정합은 제 1 마이크로폰 (146) 을 통한, 제 1 오디오 신호 (130) 의 수신과 제 2 마이크로폰 (147) 을 통한, 제 2 오디오 신호 (132) 의 수신 사이의 시간 지연을 표시할 수도 있다. 예를 들어, 시간 부정합 값의 제 1 값 (예컨대, 양의 값) 은 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 에 대해 지연된다는 것을 표시할 수도 있다. 이 예에서, 제 1 오디오 신호 (130) 는 선행 신호에 대응할 수도 있으며, 제 2 오디오 신호 (132) 는 지체된 신호에 대응할 수도 있다. 시간 부정합 값의 제 2 값 (예컨대, 음의 값) 은 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 지연된다는 것을 표시할 수도 있다. 이 예에서, 제 1 오디오 신호 (130) 는 지체된 신호에 대응할 수도 있으며, 제 2 오디오 신호 (132) 는 선행 신호에 대응할 수도 있다. 시간 부정합 값의 제 3 값 (예컨대, 0) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이에 지연 없음을 표시할 수도 있다.
일부 구현예들에서, 시간 부정합 값의 제 3 값 (예컨대, 0) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다는 것을 표시할 수도 있다. 예를 들어, 제 1 오디오 신호 (130) 의 제 1 특정의 프레임은 제 1 프레임보다 선행할 수도 있다. 제 2 오디오 신호 (132) 의 제 1 특정의 프레임 및 제 2 특정의 프레임은 사운드 소스 (152) 에 의해 방출된 동일한 사운드에 대응할 수도 있다. 동일한 사운드가 제 2 마이크로폰 (147) 에서보다 제 1 마이크로폰 (146) 에서 조기에 검출될 수도 있다. 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연은 제 2 특정의 프레임에 대해 지연된 제 1 특정의 프레임을 갖는 것으로부터 제 1 프레임에 대해 지연된 제 2 프레임을 갖는 것으로 스위칭할 수도 있다. 대안적으로, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연은 제 1 특정의 프레임에 대해 지연된 제 2 특정의 프레임을 갖는 것으로부터 제 2 프레임에 대해 지연된 제 1 프레임을 갖는 것으로 스위칭할 수도 있다. 채널간 정렬기 (108) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다고 결정하는 것에 응답하여, 도 7 을 참조하여 추가로 설명된 바와 같이, 제 3 값 (예컨대, 0) 을 표시하도록 시간 부정합 값을 설정할 수도 있다.
채널간 정렬기 (108) 는 도 7 을 참조하여 추가로 설명되는 바와 같이, 시간 부정합 값에 기초하여, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 하나를 참조 신호 (103) 로서, 그리고 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 다른 하나를 목표 신호로서 선택한다. 채널간 정렬기 (108) 는 도 7 을 참조하여 추가로 설명되는 바와 같이, 시간 부정합 값에 기초하여 목표 신호를 조정함으로써, 조정된 목표 신호 (105) 를 발생시킨다. 채널간 정렬기 (108) 는 도 7 을 참조하여 추가로 설명되는 바와 같이, 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자에 기초하여, 하나 이상의 채널간 정렬 (ICA) 파라미터들 (107) 을 발생시킨다. 채널간 정렬기 (108) 는 참조 신호 (103) 및 조정된 목표 신호 (105) 를 CP 선택기 (122), 미드사이드 발생기 (148), 또는 양자로 제공한다. 채널간 정렬기 (108) 는 ICA 파라미터들 (107) 을 CP 선택기 (122), 미드사이드 발생기 (148), 또는 양자로 제공한다.
CP 선택기 (122) 는 도 9 를 참조하여 추가로 설명되는 바와 같이, ICA 파라미터들 (107), 하나 이상의 추가적인 파라미터들, 또는 이들의 조합에 기초하여, CP 파라미터 (109) 를 발생시킨다. CP 선택기 (122) 는 참조 신호 (103) 및 조정된 목표 신호 (105) 에 대응하는 사이드 신호 (113) 가 예측을 위한 후보라는 것을 ICA 파라미터들 (107) 이 표시하는지 여부를 결정하는 것에 기초하여, CP 파라미터 (109) 를 발생시킬 수도 있다.
특정의 예에서, CP 선택기 (122) 는 시간 부정합 값에서의 변화에 기초하여 사이드 신호 (113) 가 예측을 위한 후보인지 여부를 결정한다. 시간 부정합 값은 화자의 로케이션이 제 1 마이크로폰 (146) 및 제 2 마이크로폰 (147) 의 로케이션들에 대해 변할 때 프레임들에 걸쳐서 변할 수도 있다. CP 선택기 (122) 는 시간 부정합 값이 프레임들에 걸쳐서 임계치 초과의 값 만큼 변화되고 있다고 결정하는 것에 기초하여, 사이드 신호 (113) 가 예측을 위한 후보가 아니라고 결정할 수도 있다. 시간 부정합 값에서의 더 큰 임계치 변화는 예측된 사이드 신호가 사이드 신호 (113) 와 상대적으로 상이할 (예컨대, 이의 근사치가 아닐) 가능성이 있다는 것을 표시할 수도 있다. 대안적으로, CP 선택기 (122) 는 시간 부정합 값에서의 변화가 임계치 이하라고 결정하는 것에 적어도 부분적으로 기초하여, 사이드 신호 (113) 가 예측을 위한 후보라고 결정할 수도 있다. 임계치 이하인 시간 부정합 값에서의 변화는 예측된 사이드 신호가 사이드 신호 (113) 의 상대적으로 근사치일 가능성이 있다는 것을 표시할 수도 있다. 일부 구현예들에서, 임계치는 도 9 를 참조하여 추가로 설명되는 바와 같이, CP 파라미터 (109) 의 결정에서 히스테리시스 및 평활화를 가능하게 하기 위해 프레임들에 걸쳐서 적응적으로 변화될 수도 있다.
CP 선택기 (122) 는 사이드 신호 (113) 가 예측을 위한 후보가 아니라고 결정하는 것에 응답하여, 제 1 값 (예컨대, 0) 을 갖는 CP 파라미터 (109) 를 발생시킬 수도 있다. 대안적으로, CP 선택기 (122) 는 사이드 신호 (113) 가 예측을 위한 후보라고 결정하는 것에 응답하여, 제 2 값 (예컨대, 1) 을 갖는 CP 파라미터 (109) 를 발생시킬 수도 있다.
CP 파라미터 (109) 의 제 1 값 (예컨대, 0) 은 사이드 신호 (113) 가 송신을 위해 인코딩되어야 한다는 것, 인코딩된 사이드 신호 (123) 가 제 2 디바이스 (106) 로 송신되어야 한다는 것, 그리고 디코더 (118) 가 인코딩된 사이드 신호 (123) 를 디코딩함으로써 합성된 사이드 신호 (173) 를 발생시켜야 한다는 것을 표시한다. CP 파라미터 (109) 의 제 2 값 (예컨대, 1) 은 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다는 것, 인코딩된 사이드 신호 (123) 가 제 2 디바이스 (106) 로 송신되지 않아야 한다는 것, 및 디코더 (118) 가 합성된 미드 신호 (171) 에 기초하여 합성된 사이드 신호 (173) 를 예측해야 한다는 것을 표시한다. 인코딩된 사이드 신호 (123) 가 송신되지 않을 때, 도 2 내지 도 4 를 참조하여 추가로 설명되는 바와 같이, 채널간 이득 파라미터 (예컨대, 채널간 예측 이득 파라미터) 가 대신 송신될 수도 있다.
CP 선택기 (122) 는 CP 파라미터 (109) 를 미드사이드 발생기 (148) 로 제공한다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, CP 파라미터 (109) 에 기초하여, 다운믹스 파라미터 (115) 를 결정한다. 예를 들어, CP 파라미터 (109) 가 제 1 값 (예컨대, 0) 을 가질 때, 다운믹스 파라미터 (115) 는 에너지 메트릭, 상관 메트릭, 또는 양자에 기초할 수도 있다. 에너지 메트릭은 제 1 오디오 신호 (130) 의 제 1 에너지 및 제 2 오디오 신호 (132) 의 제 2 에너지에 기초할 수도 있다. 상관 메트릭은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 상관 (예컨대, 교차-상관, 차이, 또는 유사성) 을 표시할 수도 있다. 다운믹스 파라미터 (115) 는 제 1 값 (예컨대, 0) 내지 제 2 값 (예컨대, 1) 의 범위 내 값을 갖는다. 특정의 양태에서, 다운믹스 파라미터 (115) 의 특정의 값 (예컨대, 0.5) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 가 유사한 에너지를 갖는다 (예컨대, 제 1 에너지가 제 2 에너지와 대략 동일하다) 는 것을 표시할 수도 있다. 제 2 값 (예컨대, 1) 보다 제 1 값 (예컨대, 0) 에 더 가까운 다운믹스 파라미터 (115) 의 값 (예컨대, 0.5 미만) 은 제 1 오디오 신호 (130) 의 제 1 에너지가 제 2 오디오 신호 (132) 의 제 2 에너지보다 크다는 것을 표시할 수도 있다. 제 1 값 (예컨대, 0) 보다 제 2 값 (예컨대, 1) 에 더 가까운 다운믹스 파라미터 (115) 의 값 (예컨대, 0.5 초과) 은 제 2 오디오 신호 (132) 의 제 2 에너지가 제 1 오디오 신호 (130) 의 제 1 에너지보다 크다는 것을 표시할 수도 있다. 특정의 양태에서, 다운믹스 파라미터 (115) 는 조정된 목표 신호 (105) 에 대한 참조 신호 (103) 의 상대적인 에너지를 표시할 수도 있다. CP 파라미터 (109) 가 제 2 값 (예컨대, 1) 을 가질 때, 다운믹스 파라미터 (115) 는 디폴트 파라미터 값 (예컨대, 0.5) 에 기초할 수도 있다.
미드사이드 발생기 (148) 는, 도 8 을 참조하여 추가로 설명되는 바와 같이, 다운믹스 파라미터 (115) 에 기초하여, 다운믹스 프로세싱을 수행하여, 참조 신호 (103) 및 조정된 목표 신호 (105) 에 대응하는 미드 신호 (111) 및 사이드 신호 (113) 를 발생시킨다. 예를 들어, 미드 신호 (111) 는 참조 신호 (103) 와 조정된 목표 신호 (105) 의 총합에 대응할 수도 있다. 사이드 신호 (113) 는 참조 신호 (103) 와 조정된 목표 신호 (105) 사이의 차이에 대응할 수도 있다. 미드사이드 발생기 (148) 는 미드 신호 (111), 사이드 신호 (113), 다운믹스 파라미터 (115), 또는 이들의 조합을 신호 발생기 (116) 로 제공한다.
신호 발생기 (116) 는 인코딩 미드 신호 (111), 사이드 신호 (113), 또는 양자에 대해 이용가능한 특정의 비트수를 가질 수도 있다. 신호 발생기 (116) 는 제 1 비트수가 인코딩 미드 신호 (111) 에 할당된다는 것 및 제 2 비트수가 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 표시하는 비트 할당을 결정할 수도 있다. 제 1 비트수는 제 2 비트수 이상일 수도 있다. 신호 발생기 (116) 는 인코딩된 사이드 신호 (123) 가 송신되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고 결정하는 것에 응답하여, 어떤 비트들 (예컨대, 제 2 비트수 = 제로) 도 사이드 신호 (113) 를 인코딩하는데 할당되지 않는다고 결정할 수도 있다. 신호 발생기 (116) 는 사이드 신호 (113) 를 인코딩하는데 사용된 비트들을 용도 변경할 수도 있다. 예를 들어, 신호 발생기 (116) 는 비한정적인 예로서, 용도 변경된 비트들 중 일부 또는 모두를 인코딩 미드 신호 (111) 에, 또는 송신하는 다른 파라미터들, 예컨대 하나 이상의 채널간 이득 파라미터들에, 할당할 수도 있다.
특정의 예에서, 신호 발생기 (116) 는 인코딩된 사이드 신호 (123) 가 송신되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 CP 파라미터 (109) 가 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) 에 기초하여, 비트 할당을 결정할 수도 있다. 다운믹스 파라미터 (115) 의 특정의 값 (예컨대, 0.5) 은 사이드 신호 (113) 가 더 적은 정보를 갖고 제 2 디바이스 (106) 에서 출력 신호에 더 적은 영향을 미칠 가능성이 있다는 것을 표시할 수도 있다. 특정의 값 (예컨대, 0.5) 으로부터 더 멀리 떨어져 있는, 예컨대 제 1 값 (예컨대, 0) 에 또는 제 2 값 (예컨대, 1) 에 더 가까운, 다운믹스 파라미터 (115) 의 값은 사이드 신호 (113) 가 더 많은 에너지를 갖는다는 것을 표시할 수도 있다. 신호 발생기 (116) 는 다운믹스 파라미터 (115) 가 특정의 값 (예컨대, 0.5) 에 더 가까울 때 사이드 신호 (113) 를 인코딩하는데 더 적은 비트들을 할당할 수도 있다.
신호 발생기 (116) 는 미드 신호 (111) 에 기초하여 인코딩된 미드 신호 (121) 를 발생시킬 수도 있다. 인코딩된 미드 신호 (121) 는 미드 신호 (111) 를 나타내는 하나 이상의 제 1 비트스트림 파라미터들에 대응할 수도 있다. 제 1 비트스트림 파라미터들은 비트 할당에 기초하여 발생될 수도 있다. 예를 들어, 제 1 비트스트림 파라미터들의 카운트, 제 1 비트스트림 파라미터들의 비트스트림 파라미터 (예컨대, 이를 나타내는데 사용되는 비트수) 의 정밀도, 또는 양자는 미드 신호 (111) 를 인코딩하는데 할당된 제 1 비트수에 기초할 수도 있다.
신호 발생기 (116) 는 인코딩된 사이드 신호 (123) 가 송신되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고, 제로 비트들이 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 비트 할당이 표시한다고, 또는 양자를 결정하는 것에 응답하여, 인코딩된 사이드 신호 (123) 를 발생시키는 것을 억제할 수도 있다. 대안적으로, 신호 발생기 (116) 는 인코딩된 사이드 신호 (123) 가 송신되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 CP 파라미터 (109) 가 갖는다고 그리고 양의 비트수가 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 비트 할당이 표시한다고 결정하는 것에 응답하여, 사이드 신호 (113) 에 기초하여 인코딩된 사이드 신호 (123) 를 발생시킬 수도 있다. 인코딩된 사이드 신호 (123) 는 사이드 신호 (113) 를 나타내는 하나 이상의 제 2 비트스트림 파라미터들에 대응할 수도 있다. 제 2 비트스트림 파라미터들은 비트 할당에 기초하여 발생될 수도 있다. 예를 들어, 제 2 비트스트림 파라미터들의 카운트, 제 2 비트스트림 파라미터들의 비트스트림 파라미터의 정밀도, 또는 양자는 사이드 신호 (113) 를 인코딩하는데 할당된 제 2 비트수에 기초할 수도 있다. 신호 발생기 (116) 는 다양한 인코딩 기법들을 이용하여 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 발생시킬 수도 있다. 예를 들어, 신호 발생기 (116) 는 시간-도메인 기법, 예컨대 대수 코드-여기 선형 예측 (ACELP) 을 이용하여 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 발생시킬 수도 있다. 일부 구현예들에서, 미드사이드 발생기 (148) 는 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고 결정하는 것에 응답하여, 사이드 신호 (113) 를 발생시키는 것을 억제할 수도 있다.
송신기 (110) 는 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자에 대응하는 비트스트림 파라미터들 (102) 을 송신한다. 예를 들어, 송신기 (110) 는, 인코딩된 사이드 신호 (123) 가 송신되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고, 제로 비트들이 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 비트 할당이 표시한다고, 또는 양자를 결정하는 것에 응답하여, (인코딩된 미드 신호 (121) 에 대응하는) 제 1 비트스트림 파라미터들을 비트스트림 파라미터들 (102) 로서 송신한다. 송신기 (110) 는 인코딩된 사이드 신호 (123) 가 송신되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고, 제로 비트들이 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 비트 할당이 표시한다고, 또는 양자를 결정하는 것에 응답하여, (인코딩된 사이드 신호 (123) 에 대응하는) 제 2 비트스트림 파라미터들을 송신하는 것을 억제한다. 송신기 (110) 는 도 2 내지 도 3 을 참조하여 더욱 설명되는 바와 같이, 인코딩된 사이드 신호 (123) 가 송신되지 않아야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (109) 가 갖는다고 결정하는 것에 응답하여, 하나 이상의 채널간 예측 이득 파라미터들을 송신할 수도 있다. 대안적으로, 송신기 (110) 는 인코딩된 사이드 신호 (123) 가 송신되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 CP 파라미터 (109) 가 갖는다고 그리고 양의 비트수가 사이드 신호 (113) 를 인코딩하는데 할당된다는 것을 비트 할당이 표시한다고 결정하는 것에 응답하여, 제 1 비트스트림 파라미터들 및 제 2 비트스트림 파라미터들을 비트스트림 파라미터들 (102) 로서 송신한다.
송신기 (110) 는 비트스트림 파라미터들 (102) 과 동시에 하나 이상의 코딩 파라미터들 (140) 을, 네트워크 (120) 를 통해서, 제 2 디바이스 (106) 로 송신할 수도 있다. 코딩 파라미터들 (140) 은 ICA 파라미터들 (107), 다운믹스 파라미터 (115), CP 파라미터 (109), 시간 부정합 값, 또는 하나 이상의 추가적인 파라미터들 중 적어도 하나를 포함할 수도 있다. 예를 들어, 인코더 (114) 는 도 2 를 참조하여 추가로 설명되는 바와 같이, 하나 이상의 채널간 예측 이득 파라미터들을 결정할 수도 있다. 하나 이상의 채널간 예측 이득 파라미터들은 미드 신호 (111) 및 사이드 신호 (113) 에 기초할 수도 있다. 코딩 파라미터들 (140) 은 하나 이상의 채널간 예측 이득 파라미터들, 도 2 내지 도 3 을 참조하여 더욱 설명되는 바와 같이, 포함할 수도 있다. 일부 구현예들에서, 송신기 (110) 는 비트스트림 파라미터들 (102), 코딩 파라미터들 (140), 또는 이들의 조합을, 추후 추가적인 프로세싱 또는 디코딩을 위해, 네트워크 (120) 의 디바이스 또는 로컬 디바이스에 저장할 수도 있다.
제 2 디바이스 (106) 의 디코더 (118) 는 비트스트림 파라미터들 (102), 코딩 파라미터들 (140), 또는 이들의 조합에 기초하여, 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 디코딩할 수도 있다. CP 결정기 (172) 는 도 10 을 참조하여 추가로 설명되는 바와 같이, 코딩 파라미터들 (140) 에 기초하여 CP 파라미터 (179) 를 결정할 수도 있다. CP 파라미터 (179) 의 제 1 값 (예컨대, 0) 은 비트스트림 파라미터들 (102) 이 (인코딩된 미드 신호 (121) 에 추가하여) 인코딩된 사이드 신호 (123) 에 대응한다는 것 및 합성된 사이드 신호 (173) 가 비트스트림 파라미터들 (102) 에 기초하여 (예컨대, 로부터 디코딩된) 그리고 합성된 미드 신호 (171) 와 독립적으로, 발생되어야 한다는 것을 표시한다. CP 파라미터 (179) 의 제 2 값 (예컨대, 1) 은 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다는 것 및 합성된 사이드 신호 (173) 가 합성된 미드 신호 (171) 에 기초하여 예측되어야 한다는 것을 표시한다.
일부 양태들에서, 송신기 (110) 는 CP 파라미터 (109) 를 코딩 파라미터들 (140) 로서 송신하고, CP 결정기 (172) 중 하나는 CP 파라미터 (109) 와 동일한 값을 가지는 CP 파라미터 (179) 를 발생시킨다. 다른 양태들에서, CP 결정기 (172) 는 CP 선택기 (122) 가 CP 파라미터 (109) 를 결정하기 위해 수행되는 기법들과 유사한 기법들을 CP 파라미터 (179) 를 결정하기 위해 수행한다. 예를 들어, CP 결정기 (172) 및 CP 선택기 (122) 는 인코더 (114) 및 디코더 (118) 양자에서 이용가능한 정보 (예컨대, 코어 유형 또는 코더 유형) 에 기초하여, CP 파라미터 (109) 및 CP 파라미터 (179) 를 각각 결정될 수도 있다.
CP 결정기 (172) 는 CP 파라미터 (179) 를 업믹스 파라미터 발생기 (176), 신호 발생기 (174), 또는 양자로 제공한다. 업믹스 파라미터 발생기 (176) 는 도 11 내지 도 12 를 참조하여 더욱 설명되는 바와 같이, CP 파라미터 (179), 코딩 파라미터들 (140), 또는 이들의 조합에 기초하여, 업믹스 파라미터 (175) 를 발생시킨다. 업믹스 파라미터 (175) 는 다운믹스 파라미터 (115) 에 대응할 수도 있다. 예를 들어, 인코더 (114) 는 다운믹스 파라미터 (115) 를 이용하여 다운믹스 프로세싱을 수행하여, 참조 신호 (103) 및 조정된 목표 신호 (105) 로부터 미드 신호 (111) 및 사이드 신호 (113) 를 발생시킬 수도 있다. 신호 발생기 (174) 는 업믹스 파라미터 (175) 를 이용하여 업믹스 프로세싱을 수행하여, 합성된 미드 신호 (171) 및 합성된 사이드 신호 (173) 로부터 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 를 발생시킬 수도 있다.
일부 양태들에서, 송신기 (110) 는 다운믹스 파라미터 (115) 를 코딩 파라미터들 (140) 로서 송신하며, 업믹스 파라미터 발생기 (176) 중 하나는 다운믹스 파라미터 (115) 에 대응하는 업믹스 파라미터 (175) 를 발생시킨다. 다른 양태들에서, 업믹스 파라미터 발생기 (176) 는 미드사이드 발생기 (148) 가 다운믹스 파라미터 (115) 를 결정하기 위해 수행하는 기법과 유사한 기법들을 업믹스 파라미터 (175) 를 결정하기 위해 수행한다. 예를 들어, 미드사이드 발생기 (148) 및 업믹스 파라미터 발생기 (176) 는 인코더 (114) 및 디코더 (118) 양자에서 이용가능한 정보 (예컨대, 보이싱 인자) 에 기초하여, 다운믹스 파라미터 (115) 및 업믹스 파라미터 (175) 를 각각 결정할 수도 있다.
특정의 양태에서, 업믹스 파라미터 발생기 (176) 는 다수의 업믹스 파라미터들을 발생시킨다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 도 11 의 1100 을 참조하여 추가로 설명된 바와 같은 제 1 업믹스 파라미터 (175), 도 11 의 1102 를 참조하여 추가로 설명된 바와 같은 제 2 업믹스 파라미터 (175), 도 12 를 참조하여 추가로 설명된 바와 같은 제 3 업믹스 파라미터 (175), 또는 이들의 조합을 발생시킨다. 본 양태에서, 신호 발생기 (174) 는 다수의 업믹스 파라미터들을 이용하여 합성된 미드 신호 (171) 및 합성된 사이드 신호 (173) 로부터 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 를 발생시킨다. 특정의 예에서, 업믹스 파라미터 (175) 는 ICA 이득 파라미터 (709), ICA 파라미터들 (107) (예컨대, TMV (943)), ICP (208), 또는 업믹스 구성 중 하나 이상을 포함한다. 업믹스 구성은 업믹스 파라미터 (175) 에 기초하여, 합성된 미드 신호 (171) 및 합성된 사이드 신호 (173) 을 믹싱하여 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 를 발생시키는 구성을 표시한다.
특정의 양태에서, 인코더 (114) 는 디폴트 파라미터 값들을 가지는 파라미터들 (예컨대, 코딩 파라미터들 (140) 중 하나 이상) 의 송신을 개시하는 것을 억제함으로써, 네트워크 리소스들 (예컨대, 대역폭) 을 절약할 수도 있다. 예를 들어, 인코더 (114) 는, 제 1 파라미터가 디폴트 파라미터 값 (예컨대, 0) 에 매칭한다고 결정하는 것에 응답하여, 제 1 파라미터를 코딩 파라미터들 (140) 중 하나로서 송신하는 것을 억제한다. 디코더 (118) 는, 코딩 파라미터들 (140) 이 제 1 파라미터를 포함하지 않는다고 결정하는 것에 응답하여, 디폴트 파라미터 값 (예컨대, 0) 에 기초하여, 대응하는 제 2 파라미터를 결정한다. 대안적으로, 인코더 (114) 는, 제 1 파라미터가 디폴트 파라미터 값 (예컨대, 1) 과 매칭하지 않는다고 결정하는 것에 응답하여, 코딩 파라미터들 (140) 중 하나로서 제 1 파라미터의 (송신기 (110) 를 통한) 송신을 개시한다. 디코더 (118) 는 코딩 파라미터들 (140) 이 제 1 파라미터를 포함한다고 결정하는 것에 응답하여, 제 1 파라미터에 기초하여, 대응하는 제 2 파라미터를 결정한다.
특정의 예에서, 제 1 파라미터는 CP 파라미터 (109) 를 포함하며, 대응하는 제 2 파라미터는 CP 파라미터 (179) 를 포함하며, 디폴트 파라미터 값은 제 1 값 (예컨대, 0) 또는 제 2 값 (예컨대, 1) 을 포함한다. 다른 예에서, 제 1 파라미터는 다운믹스 파라미터 (115) 를 포함하고, 대응하는 제 2 파라미터는 업믹스 파라미터 (175) 를 포함하고, 디폴트 파라미터 값은 특정의 값 (예컨대, 0.5) 을 포함한다.
신호 발생기 (174) 는 CP 파라미터 (179) 에 기초하여, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하는지 여부를 결정한다. 예를 들어, 신호 발생기 (174) 는 CP 파라미터 (179) 의 제 2 값 (예컨대, 1) 에 기초하여, 비트스트림 파라미터들 (102) 이 인코딩된 미드 신호 (121) 를 나타내고 인코딩된 사이드 신호 (123) 에 대응하지 않는다고 결정한다. 특정의 양태에서, 신호 발생기 (174) 는 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 나타내기 위한 가용 비트들의 모두가 인코딩된 미드 신호 (121) 를 나타내기 위해 할당되었다고 결정할 수도 있다. 신호 발생기 (174) 는 비트스트림 파라미터들 (102) 을 디코딩함으로써 합성된 미드 신호 (171) 를 발생시킨다. 특정의 양태에서, 합성된 미드 신호 (171) 는 저-대역 합성된 미드 신호 또는 고-대역 합성된 미드 신호에 대응한다. 신호 발생기 (174) 는 도 2 및 도 4 를 참조하여 추가로 설명된 바와 같이, 합성된 미드 신호 (171) 에 기초하여, 합성된 사이드 신호 (173) 를 발생시킨다 (예컨대, 예측한다). 예를 들어, 신호 발생기 (174) 는 채널간 예측 이득을 합성된 미드 신호 (171) 에 적용함으로써, 합성된 사이드 신호 (173) 를 발생시킨다. 특정의 양태에서, 합성된 사이드 신호 (173) 는 저-대역 합성된 사이드 신호에 대응한다.
특정의 예에서, 신호 발생기 (174) 는 CP 파라미터 (179) 의 제 1 값 (예컨대, 0) 에 기초하여, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 및 인코딩된 미드 신호 (121) 에 대응한다고 결정한다. 신호 발생기 (174) 는 비트스트림 파라미터들 (102) 을 디코딩함으로써, 합성된 미드 신호 (171) 및 합성된 사이드 신호 (173) 를 발생시킨다. 신호 발생기 (174) 는 인코딩된 미드 신호 (121) 에 대응하는 비트스트림 파라미터들 (102) 의 제 1 세트를 디코딩함으로써, 합성된 미드 신호 (171) 를 발생시킨다. 신호 발생기 (174) 는 인코딩된 사이드 신호 (123) 에 대응하는 비트스트림 파라미터들 (102) 의 제 2 세트를 디코딩함으로써, 합성된 사이드 신호 (173) 를 발생시킨다. 비트스트림 파라미터들 (102) 의 제 2 세트를 디코딩함으로써 합성된 사이드 신호 (173) 를 발생시키는 것은 합성된 미드 신호 (171) 와 독립적으로, 또는 부분적으로 기초하여, 합성된 사이드 신호 (173) 를 발생시키는 것에 대응할 수도 있다. 특정의 양태에서, 합성된 사이드 신호 (173) 는 합성된 미드 신호 (171) 를 발생시키는 것과 동시에, 발생될 수도 있다. 다른 특정의 예에서, 신호 발생기 (174) 는 CP 파라미터 (179) 의 제 2 값 (예컨대, 1) 에 기초하여, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다고 결정한다. 신호 발생기 (174) 는 비트스트림 파라미터들 (102) 을 디코딩함으로써 합성된 미드 신호 (171) 를 발생시키며, 신호 발생기 (174) 는 도 2 및 도 4 를 참조하여 설명된 바와 같이, 제 1 디바이스 (104) 로부터 수신된 하나 이상의 채널간 예측 이득 파라미터들 및 합성된 미드 신호 (171) 에 기초하여, 합성된 사이드 신호 (173) 를 발생시킨다.
신호 발생기 (174) 는 업믹스 파라미터 (175) 에 기초하여, 업믹싱을 수행하여, 합성된 미드 신호 (171) 및 합성된 사이드 신호 (173) 로부터 (예컨대, 제 1 오디오 신호 (130) 에 대응하는) 제 1 출력 신호 (126) 및 (예컨대, 제 2 오디오 신호 (132) 에 대응하는) 제 2 출력 신호 (128) 를 발생시킬 수도 있다. 예를 들어, 신호 발생기 (174) 는 미드사이드 발생기 (148) 에 의해 사용되는 다운믹싱 알고리즘들에 대응하는 업믹싱 알고리즘들을 이용하여 미드 신호 (111) 및 사이드 신호 (113) 를 발생시킬 수도 있다. 특정의 양태에서, 합성된 미드 신호 (171) 는 고-대역 합성된 미드 신호에 대응한다. 본 양태에서, 신호 발생기 (174) 는 고-대역 합성된 미드 신호에 대해 채널간 대역폭 확장 (BWE) 을 수행함으로써, 제 1 출력 신호 (126) 의 제 1 고-대역 출력 신호를 발생시킨다. 예를 들어, 비트스트림 파라미터들 (102) 은 하나 이상의 채널간 BWE 파라미터들을 포함할 수도 있다. 채널간 BWE 파라미터들은 조정 이득 파라미터들의 세트를 포함할 수도 있다. 특정의 구현예에서, 신호 발생기 (174) 는 제 1 조정 이득 파라미터에 기초하여 고-대역 합성된 미드 신호를 스케일링함으로써 제 1 고-대역 출력 신호를 발생시킬 수도 있다. 신호 발생기 (174) 는 고-대역 합성된 미드 신호에 대해 채널간 대역폭 확장을 수행하는 것에 기초하여 제 2 출력 신호 (128) 의 제 2 고-대역 출력 신호를 발생시킨다. 예를 들어, 신호 발생기 (174) 는 제 2 조정 이득 파라미터에 기초하여 고-대역 합성된 미드 신호를 스케일링함으로써, 제 2 고-대역 출력 신호를 발생시킨다. 신호 발생기 (174) 는 업믹스 파라미터 (175) 에 기초하여, 저-대역 합성된 미드 신호 및 저-대역 합성된 사이드 신호를 업믹싱함으로써, 제 1 출력 신호 (126) 의 제 1 저-대역 출력 신호를 발생시킨다. 제 1 출력 신호 (126) 의 제 2 저-대역 출력 신호는 업믹스 파라미터 (175) 에 기초하여, 저-대역 합성된 미드 신호 및 저-대역 합성된 사이드 신호를 업믹싱하는 것에 기초한다. 신호 발생기 (174) 는 제 1 저-대역 출력 신호와 제 1 고-대역 출력 신호를 결합함으로써, 제 1 출력 신호 (126) 를 발생시킨다. 신호 발생기 (174) 는 제 2 저-대역 출력 신호와 제 2 고-대역 출력 신호를 결합함으로써, 제 2 출력 신호 (128) 를 발생시킨다.
특정의 양태에서, 신호 발생기 (174) 는 특정의 시간 부정합 값에 기초하여, 제 1 출력 신호 (126) 또는 제 2 출력 신호 (128) 중 적어도 하나를 조정한다. 코딩 파라미터들 (140) 은 특정의 시간 부정합 값을 표시할 수도 있다. 특정의 시간 부정합 값은 조정된 목표 신호 (105) 를 발생시키기 위해 채널간 정렬기 (108) 에 의해 사용되는 시간 부정합 값에 대응할 수도 있다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142) 를 통해서 제 1 출력 신호 (126) (또는, 조정된 제 1 출력 신호 (126)) 를, 제 2 라우드스피커 (144) 를 통해서 제 2 출력 신호 (128) (또는, 조정된 제 2 출력 신호 (128)) 를, 또는 양자를 출력할 수도 있다.
시스템 (100) 은 네트워크 리소스들 사용 (예컨대, 대역폭) 의 동적 조정, (예컨대, 오디오 신호들 (130, 132) 을 근사화하는 관점에서) 출력 신호들 (126, 128) 의 품질, 또는 양자를 가능하게 한다. 사이드 신호 (113) 가 예측을 위한 후보가 아닐 때, 비트 할당은 다운믹스 파라미터 (115) 에 기초하여 동적으로 조정될 수도 있다. 사이드 신호 (113) 가 더 적은 정보를 포함한다고 다운믹스 파라미터 (115) 가 표시할 때 인코딩된 사이드 신호 (123) 를 나타내는데 더 적은 비트들이 사용될 수도 있다. 인코딩된 사이드 신호 (123) 를 나타내는 비트수를 감소시키는 것은 사이드 신호 (113) 가 더 적은 정보를 포함할 때 출력 신호들 (126, 128) 의 품질에 적은 영향을 미칠 (예컨대, 인지불가능할) 수도 있다. 인코딩된 사이드 신호 (123) 를 나타내는데 사용된 비트들은 인코딩된 미드 신호 (121) 를 나타내기 위해 용도 변경될 수도 있다 (예컨대, 인코딩된 미드 신호 (121) 의 추가적인 비트들이 제 2 디바이스 (106) 로 송신될 수도 있다). 합성된 미드 신호 (171) 는 추가적인 비트들로 인해 미드 신호 (111) 에 더 가깝게 근접할 수도 있다.
사이드 신호 (113) 가 예측을 위한 후보일 때, 신호 발생기 (116) 는 인코딩된 사이드 신호 (123) 에 대응하는 비트스트림 파라미터들을 송신하는 것을 억제한다. 특정의 양태에서, 송신기 (110) 는 인코딩된 사이드 신호 (123) 에 대응하는 비트스트림 파라미터들을 송신하는 것을 억제함으로써, 더 적은 네트워크 리소스들을 사용한다. 디코더 (118) 는 인코딩된 사이드 신호 (123) 를 나타내는 비트스트림 파라미터들을 디코딩함으로써 합성된 사이드 신호 (173) (예컨대, 디코딩된 사이드 신호) 를 발생시키는 것과 비교하여, 합성된 미드 신호 (171) 에 기초하여, 합성된 사이드 신호 (173) (예컨대, 예측된 사이드 신호) 를 발생시킬 수도 있다.
사이드 신호 (113) 가 예측을 위한 후보일 때, 합성된 사이드 신호 (173) (예컨대, 예측된 사이드 신호) 에 기초하여 발생된 출력 신호들 (예컨대, 제 1 출력 신호 (126) 및 제 2 출력 신호 (128)) 과 디코딩된 사이드 신호에 기초한 출력 신호들 사이의 차이는 청취자에게 비교적 눈에 띄지 않을 수도 있다. 따라서, 시스템 (100) 은 송신기 (110) 가 출력 신호들의 오디오 품질에 대한 작은 (예컨대, 인지불가능한) 영향으로 네트워크 리소스들 (예컨대, 대역폭) 을 절약가능하게 할 수도 있다.
특정의 양태에서, 인코더 (114) 는 인코딩된 사이드 신호 (123) 를 송신하는데 사용된 비트들을 용도 변경한다. 예를 들어, 신호 발생기 (116) 는 인코딩된 미드 신호 (121), 코딩 파라미터들 (140), 또는 이들의 조합을 더 잘 나타내기 위해, 용도 변경된 비트들 중 적어도 일부를 할당할 수도 있다. 예시하기 위하여, 더 많은 비트들이 인코딩된 미드 신호 (121) 에 대응하는 비트스트림 파라미터들 (102) 을 나타내는데 사용될 수도 있다. 인코딩된 미드 신호 (121) 를 나타내는 추가적인 비트들을 송신하는 것은 미드 신호 (111) 에 더 가깝게 근접하는 합성된 미드 신호 (171) 를 초래할 수도 있다. (예컨대, 추가적인 비트들을 포함하는) 합성된 미드 신호 (171) 에 기초하여 예측된 합성된 사이드 신호 (173) 는 사이드 신호 (113) 에 (디코딩된 사이드 신호와 비교하여) 더 가깝게 근접할 수도 있다.
따라서, 시스템 (100) 은 사이드 신호 (113) 가 예측을 위한 후보일 때, 사이드 신호 (113) 가 더 적은 정보를 포함할 때, 또는 양자일 때 송신기 (110) 가 인코딩된 미드 신호 (121) 를 나타내는데 더 많은 비트들을 사용함으로써, 디코더 (118) 가 오디오 신호들 (130, 132) 에 더 가깝게 근접한 출력 신호들 (126, 128) 을 발생시키게 할 수도 있다. 이와 같이, 시스템 100 은 출력 신호들 (126, 128) 과 연관된 청취 경험을 향상시킬 수도 있다.
도 2 를 참조하면, 채널간 예측 이득 파라미터에 기초하여 사이드 신호를 합성하는 시스템 (200) 의 특정의 예시적인 예가 도시된다. 특정의 구현예에서, 도 2 의 시스템 (200) 은 합성된 미드 신호에 기초하여 합성된 사이드 신호를 예측한다는 결정 후 도 1 의 시스템 (100) 을 포함하거나 또는 이에 대응한다. 시스템 (200) 은 네트워크 (205) 를 통해서 제 2 디바이스 (206) 에 통신가능하게 커플링된 제 1 디바이스 (204) 를 포함한다. 네트워크 (205) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 제 1 디바이스 (204), 네트워크 (205), 및 제 2 디바이스 (206) 는 도 1 의, 제 1 디바이스 (104), 네트워크 (120), 및 제 2 디바이스 (106) 를 각각 포함하거나 또는 이에 대응할 수도 있다. 특정의 구현예에서, 제 1 디바이스 (204) 는 모바일 디바이스를 포함하거나 또는 이에 대응한다. 다른 특정의 구현예에서, 제 1 디바이스 (204) 는 기지국을 포함하거나 또는 이에 대응한다. 특정의 구현예에서, 제 2 디바이스 (206) 는 모바일 디바이스를 포함하거나 또는 이에 대응한다. 다른 특정의 구현예에서, 제 2 디바이스 (206) 는 기지국을 포함하거나 또는 이에 대응한다.
제 1 디바이스 (204) 는 인코더 (214), 송신기 (210), 하나 이상의 입력 인터페이스들 (212), 또는 이들의 조합을 포함할 수도 있다. 입력 인터페이스들 (212) 의 제 1 입력 인터페이스는 제 1 마이크로폰 (246) 에 커플링될 수도 있다. 입력 인터페이스들 (212) 의 제 2 입력 인터페이스는 제 2 마이크로폰 (248) 에 커플링될 수도 있다. 제 1 마이크로폰 (246) 및 제 2 마이크로폰 (248) 은 하나 이상의 오디오 입력들을 캡쳐하고 오디오 신호들을 발생시키도록 구성될 수도 있다. 예를 들어, 제 1 마이크로폰 (246) 은 사운드 소스 (240) 에 의해 발생된 하나 이상의 오디오 사운드들을 캡쳐하고 하나 이상의 오디오 사운드들에 기초하여 제 1 오디오 신호 (230) 를 출력하도록 구성될 수도 있으며, 제 2 마이크로폰 (248) 은 사운드 소스 (240) 에 의해 발생된 하나 이상의 오디오 사운드들을 캡쳐하고 하나 이상의 오디오 사운드들에 기초하여 제 2 오디오 신호 (232) 를 출력하도록 구성될 수도 있다.
인코더 (214) 는 도 1 을 참조하여 설명된 바와 같이, 오디오 신호들을 다운믹싱 및 인코딩하도록 구성될 수도 있다. 특정의 구현예에서, 인코더 (214) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 대해 하나 이상의 정렬 동작들을 수행하도록 구성될 수도 있다. 인코더 (214) 는 신호 발생기 (216), 채널간 예측 이득 파라미터 (ICP) 발생기 (220), 및 비트스트림 발생기 (222) 를 포함한다. 신호 발생기 (216) 는 ICP 발생기 (220) 에 그리고 비트스트림 발생기 (222) 에 커플링될 수도 있으며, ICP 발생기 (220) 는 비트스트림 발생기 (222) 에 커플링될 수도 있다. 신호 발생기 (216) 는 도 1 을 참조하여 설명된 바와 같이, 입력 인터페이스들 (212) 을 통해서 수신된 입력 오디오 신호들에 기초하여, 오디오 신호들을 발생시키도록 구성된다. 예를 들어, 신호 발생기 (216) 는 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 기초하여, 미드 신호 (211) 를 발생시키도록 구성될 수도 있다. 다른 예로서, 신호 발생기 (216) 는 또한 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 기초하여, 사이드 신호 (213) 를 발생시키도록 구성될 수도 있다. 신호 발생기 (216) 는 또한 하나 이상의 오디오 신호들을 인코딩하도록 구성된다. 예를 들어, 신호 발생기 (216) 는 미드 신호 (211) 에 기초하여, 인코딩된 미드 신호 (215) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 미드 신호 (211), 사이드 신호 (213), 및 인코딩된 미드 신호 (215) 는 도 1 의, 미드 신호 (111), 사이드 신호 (113), 및 인코딩된 미드 신호 (115) 를 각각 포함하거나 또는 이에 대응한다. 신호 발생기 (216) 는 미드 신호 (211) 및 사이드 신호 (213) 를 ICP 발생기 (220) 로 제공하고 인코딩된 미드 신호 (215) 를 비트스트림 발생기 (222) 로 제공하도록 추가로 구성될 수도 있다. 특정의 구현예에서, 인코더 (214) 는 미드 신호 (211) 및 사이드 신호 (213) 를 ICP 발생기 (220) 로 제공하기 전에 (예컨대, 채널간 예측 이득 파라미터를 발생시키기 전에) 하나 이상의 필터들을 미드 신호 (211) 및 사이드 신호 (213) 에 적용하도록 구성될 수도 있다.
ICP 발생기 (220) 는 미드 신호 (211) 및 사이드 신호 (213) 에 기초하여, 채널간 예측 이득 파라미터 (ICP) (208) 를 발생시키도록 구성된다. 예를 들어, ICP 발생기 (220) 는 도 3 을 참조하여 추가로 설명되는 바와 같이, 사이드 신호 (213) 의 에너지에 기초하여 또는 미드 신호 (211) 의 에너지 및 사이드 신호 (213) 의 에너지에 기초하여, ICP (208) 를 발생시키도록 구성될 수도 있다. 대안적으로, ICP 발생기 (220) 는 도 3 을 참조하여 추가로 설명되는 바와 같이, 미드 신호 (211) 및 사이드 신호 (213) 에 대해 수행되는 동작 (예컨대, 내적 동작) 에 기초하여, ICP (208) 를 결정하도록 구성될 수도 있다. ICP (208) 는 미드 신호 (211) 와 사이드 신호 (213) 사이의 관계를 나타낼 수도 있으며, ICP (208) 는 본원에서 추가로 설명되는 바와 같이, 합성된 미드 신호로부터 사이드 신호를 합성하기 위해 디코더에 의해 사용될 수도 있다. 단일 ICP (208) 파라미터가 발생되는 것으로 예시되지만, 다른 구현예들에서, 다수의 ICP 파라미터들이 발생될 수도 있다. 구체적인 예로서, 도 3 을 참조하여 추가로 설명되는 바와 같이, 미드 신호 (211) 및 사이드 신호 (213) 는 다수의 대역들로 필터링될 수도 있으며, 다수의 대역들의 각각에 대응하는 ICP 가 발생될 수도 있다. ICP 발생기 (220) 는 ICP (208) 를 비트스트림 발생기 (222) 로 제공하도록 추가로 구성될 수도 있다.
비트스트림 발생기 (222) 는 인코딩된 미드 신호 (215) 을 수신하고 (다른 파라미터들에 추가하여) 인코딩된 오디오 신호를 나타내는 하나 이상의 비트스트림 파라미터들 (202) 을 발생시키도록 구성될 수도 있다. 예를 들어, 인코딩된 오디오 신호는 인코딩된 미드 신호 (215) 를 포함하거나 또는 이에 대응할 수도 있다. 비트스트림 발생기 (222) 는 또한 ICP (208) 를 하나 이상의 비트스트림 파라미터들 (202) 에 포함시키도록 구성될 수도 있다. 대안적으로, 비트스트림 발생기 (222) 는 ICP (208) 가 하나 이상의 비트스트림 파라미터들 (202) 로부터 유도될 수 있도록, 하나 이상의 비트스트림 파라미터들 (202) 을 발생시키도록 구성될 수도 있다. 일부 구현예들에서, 하나 이상의 추가적인 파라미터들, 예컨대 상관 파라미터는, 도 13 및 도 15 를 참조하여 추가로 설명된 바와 같이, 하나 이상의 비트스트림 파라미터들 (202) 에 포함되거나, 이에 의해 표시되거나, 또는 이에 추가하여 전송될 수도 있다. 송신기 (210) 는 ICP (208) 를 포함하는 (또는, 이에 추가하여) 하나 이상의 비트스트림 파라미터들 (202) (예컨대, 인코딩된 미드 신호 (215)) 를 네트워크 (205) 를 통해서 제 2 디바이스 (206) 로 전송하도록 구성될 수도 있다. 특정의 구현예에서, 하나 이상의 비트스트림 파라미터들 (202) 은 도 1 의 하나 이상의 비트스트림 파라미터들 (102) 을 포함하거나 또는 이에 대응하며, ICP (208) 는 도 1 의 하나 이상의 비트스트림 파라미터들 (102) 에 포함된 (또는, 이에 추가하여 전송된) 하나 이상의 코딩 파라미터들 (140) 에 포함된다.
제 2 디바이스 (206) 는 디코더 (218) 및 수신기 (260) 를 포함할 수도 있다. 수신기 (260) 는 제 1 디바이스 (204) 로부터 네트워크 (205) 를 통해서 ICP (208) 및 하나 이상의 비트스트림 파라미터들 (202) (예컨대, 인코딩된 미드 신호 (215)) 를 수신하도록 구성될 수도 있다. 디코더 (218) 는 오디오 신호들을 업믹싱 및 디코딩하도록 구성될 수도 있다. 예시하기 위하여, 디코더 (218) 는 (ICP (208) 를 포함하는) 하나 이상의 비트스트림 파라미터들 (202) 에 기초하여, 하나 이상의 오디오 신호들을 디코딩 및 업믹싱하도록 구성될 수도 있다.
디코더 (218) 는 신호 발생기 (274) 를 포함할 수도 있다. 특정의 구현예에서, 신호 발생기 (274) 는 도 1 의 신호 발생기 (174) 를 포함하거나 또는 이에 대응한다. 신호 발생기 (274) 는 인코딩된 미드 신호 (225) 에 기초하여 합성된 미드 신호 (252) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 제 2 디바이스 (206) (또는, 디코더 (218)) 는 하나 이상의 비트스트림 파라미터들 (202) 에 기초하여 인코딩된 미드 신호 (225) 를 결정하거나 또는 발생시키도록 구성된 추가적인 회로부를 포함한다. 대안적으로, 신호 발생기 (274) 는 하나 이상의 비트스트림 파라미터들 (202) 로부터 합성된 미드 신호 (252) 를 직접 발생시키도록 구성될 수도 있다.
신호 발생기 (274) 는 합성된 미드 신호 (252) 및 ICP (208) 에 기초하여 합성된 사이드 신호 (254) 를 발생시키도록 추가로 구성될 수도 있다. 특정의 구현예에서, 신호 발생기 (274) 는 ICP (208) 를 합성된 미드 신호 (252) 에 적용하여 (예컨대, 합성된 미드 신호 (252) 를 ICP (208) 와 곱하여) 합성된 사이드 신호 (254) 를 발생시키도록 구성된다. 다른 구현예들에서, 합성된 사이드 신호 (254) 는 도 4 를 참조하여 추가로 설명되는 바와 같이, 다른 방법들로 발생된다. 일부 구현예들에서, 도 13 내지 도 16 을 참조하여 더욱 설명되는 바와 같이, ICP (208) 를 합성된 미드 신호 (252) 에 적용하는 것은 중간 합성된 사이드 신호를 발생시키며, 추가적인 프로세싱이 중간 합성된 사이드 신호에 대해 수행되어 합성된 사이드 신호 (254) 를 발생시킨다. 추가적으로, 또는 대안적으로, 하나 이상의 불연속성 감소 동작들은 도 14 를 참조하여 추가로 설명되는 바와 같이, 합성된 사이드 신호 (254) 에 대해 선택적으로 수행될 수도 있다. 디코더 (218) 는 합성된 미드 신호 (252) 및 합성된 사이드 신호 (254) 를 추가로 프로세싱 및 업믹싱하여 하나 이상의 출력 오디오 신호들을 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 출력 오디오 신호들은 좌측 오디오 신호 및 우측 오디오 신호를 포함한다.
출력 오디오 신호들은 하나 이상의 오디오 출력 디바이스들에서 렌더링되어 출력될 수도 있다. 예시하기 위하여, 제 2 디바이스 (206) 는 제 1 라우드스피커 (242), 제 2 라우드스피커 (244), 또는 양자에 커플링될 수도 있다 (또는, 이를 포함할 수도 있다). 제 1 라우드스피커 (242) 는 제 1 출력 신호 (226) 에 기초하여 오디오 출력을 발생시키도록 구성될 수도 있으며, 제 2 라우드스피커 (244) 는 제 2 출력 신호 (228) 에 기초하여 오디오 출력을 발생시키도록 구성될 수도 있다.
동작 동안, 제 1 디바이스 (204) 는 제 1 마이크로폰 (246) 으로부터 제 1 입력 인터페이스를 통해서 제 1 오디오 신호 (230) 를 수신할 수도 있으며, 제 2 마이크로폰 (248) 으로부터 제 2 입력 인터페이스를 통해서 제 2 오디오 신호 (232) 를 수신할 수도 있다. 제 1 오디오 신호 (230) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (232) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다. 제 1 마이크로폰 (246) 및 제 2 마이크로폰 (248) 은 사운드 소스 (240) (예컨대, 사용자, 스피커, 주변 잡음, 악기, 등) 로부터 오디오를 수신할 수도 있다. 특정의 양태에서, 제 1 마이크로폰 (246), 제 2 마이크로폰 (248), 또는 양자는 다수의 사운드 소스들로부터 오디오를 수신할 수도 있다. 다수의 사운드 소스들은 지배적인 (또는, 대부분의 지배적인) 사운드 소스 (예컨대, 사운드 소스 (240)) 및 하나 이상의 2차 사운드 소스들을 포함할 수도 있다. 인코더 (214) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (230) 와 제 2 오디오 신호 (232) 사이의 시간 시프트 또는 시간 지연을 고려하기 위해 하나 이상의 정렬 동작들을 수행할 수도 있다.
인코더 (214) 는 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 기초하여 오디오 신호들을 발생시킬 수도 있다. 예를 들어, 신호 발생기 (216) 는 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 기초하여 미드 신호 (211) 를 발생시킬 수도 있다. 다른 예로서, 신호 발생기 (216) 는 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 에 기초하여 사이드 신호 (213) 를 발생시킬 수도 있다. 미드 신호 (211) 는 제 2 오디오 신호 (232) 와 중첩된 제 1 오디오 신호 (230) 를 나타낼 수도 있으며, 사이드 신호 (213) 는 제 1 오디오 신호 (230) 와 제 2 오디오 신호 (232) 사이의 차이를 나타낼 수도 있다. 미드 신호 (211) 및 사이드 신호 (213) 는 ICP 발생기 (220) 로 제공될 수도 있다. 신호 발생기 (216) 는 또한 미드 신호 (211) 를 인코딩하여 인코딩된 미드 신호 (215) 를 발생시킬 수도 있으며, 이는 비트스트림 발생기 (222) 로 제공된다. 인코딩된 미드 신호 (215) 는 미드 신호 (211) 를 나타내는 하나 이상의 비트스트림 파라미터들에 대응할 수도 있다.
ICP 발생기 (220) 는 미드 신호 (211) 및 사이드 신호 (213) 에 기초하여 ICP (208) 를 발생시킬 수도 있다. ICP (208) 는 인코더 (214) 에서의 미드 신호 (211) 와 사이드 신호 (213) 사이의 관계 (또는, 디코더 (218) 에서의 합성된 미드 신호 (252) 와 합성된 사이드 신호 (254) 사이의 관계) 를 나타낼 수도 있다. ICP (208) 는 비트스트림 발생기 (222) 로 제공될 수도 있다. 일부 구현예들에서, ICP (208) 는 도 3 을 참조하여 추가로 설명되는 바와 같이, 이전 프레임들과 연관된 채널간 예측 이득 파라미터들에 기초하여 평활화될 수도 있다.
비트스트림 발생기 (222) 는 인코딩된 미드 신호 (215) 및 ICP (208) 를 수신하고 하나 이상의 비트스트림 파라미터들 (202) 을 발생시킬 수도 있다. 예를 들어, 인코딩된 미드 신호 (215) 는 비트스트림 파라미터들을 포함할 수도 있으며, 하나 이상의 비트스트림 파라미터들은 비트스트림 파라미터들을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 비트스트림 파라미터들 (202) 은 ICP (208) 를 포함한다. 대안적인 구현예에서, 하나 이상의 비트스트림 파라미터들 (202) 은 ICP (208) 가 유도될 수 있게 하는 하나 이상의 파라미터들을 포함한다 (예컨대, ICP (208) 는 하나 이상의 비트스트림 파라미터들 (202) 로부터 유도된다). (ICP (208) 를 포함하거나 또는 표시하는) 비트스트림 파라미터들 (202) 이 송신기 (210) 에 의해 네트워크 (205) 를 통해서 제 2 디바이스 (206) 로 전송된다.
특정의 구현예에서, ICP (208) 는 프레임 단위로 발생된다. 예를 들어, ICP (208) 는 인코딩된 미드 신호 (215) 의 제 1 오디오 프레임과 연관된 제 1 값 및 인코딩된 미드 신호 (215) 의 제 2 오디오 프레임과 연관된 제 2 값을 가질 수도 있다. ICP (208) 는 도 1 을 참조하여 설명된 바와 같이, 합성된 사이드 신호 (254) 가 (인코딩 대신) 예측되어야 한다는 결정과 연관된 각각의 프레임에 대한 하나 이상의 비트스트림 파라미터들 (202) 과 함께 전송된다 (예컨대, 이에 포함된다). 이들 프레임들에 대해, ICP (208) 가 전송되며, 인코딩된 사이드 신호의 하나 이상의 오디오 프레임들은 전송되지 않는다. 예시하기 위하여, 비트스트림 발생기 (222) 는 포함되는 ICP (208) 에 응답하여 인코딩된 사이드 신호를 표시하는 파라미터들을 포함시키는 것을 억제할 수도 있다 (예컨대, 제 1 디바이스 (204) 는 하나 이상의 프레임들에 대한 ICP (208) 를 전송하는 것에 응답하여 하나 이상의 프레임들에 대한 인코딩된 사이드 신호를 전송하는 것을 억제한다). 사이드 신호 (213) 를 인코딩하기 위한 결정과 연관되는 프레임들에 대해, 하나 이상의 비트스트림 파라미터들 (202) 은 인코딩된 사이드 신호의 프레임들을 표시하는 파라미터들을 포함하며, ICP (208) 를 포함하지 (또는, 표시하지) 않는다. 따라서, 인코딩된 사이드 신호를 표시하는 ICP (208) 또는 파라미터들 (예컨대, 둘다는 아님) 이 미드 신호 (211) 및 사이드 신호 (213) 의 각각의 프레임에 대한 하나 이상의 비트스트림 파라미터들 (202) 에 포함된다. ICP (208) 가 인코딩된 사이드 신호보다 더 적은 비트들을 사용하기 때문에, 인코딩된 사이드 신호를 전송하는데 달리 사용될 비트들은 대신 "용도 변경되어" 인코딩된 미드 신호 (215) 의 추가적인 비트들을 전송하는데 사용될 수도 있으며, 이에 의해 인코딩된 미드 신호 (215) 의 품질을 향상시킨다 (이는, 합성된 사이드 신호 (254) 가 합성된 미드 신호 (252) 로부터 예측되므로, 합성된 미드 신호 (252) 및 합성된 사이드 신호 (254) 의 품질을 향상시킨다).
제 2 디바이스 (206) (예컨대, 수신기 (260)) 는 ICP (208) 를 포함하는 (또는, 표시하는) (인코딩된 미드 신호 (215) 를 표시하는) 하나 이상의 비트스트림 파라미터들 (202) 을 수신할 수도 있다. 디코더 (218) 는 하나 이상의 비트스트림 파라미터들 (202) 에 기초하여 인코딩된 미드 신호 (225) 를 결정할 수도 있다. 인코딩된 미드 신호 (225) 는 송신 동안의 에러들로 인해 또는 하나 이상의 비트스트림 파라미터들 (202) 을 인코딩된 미드 신호 (225) 로 변환하는 프로세스로 인해, 약간의 차이들이 있지만, 인코딩된 미드 신호 (215) 와 유사할 수도 있다. 신호 발생기 (274) 는 인코딩된 미드 신호 (225) (예컨대, 하나 이상의 비트스트림 파라미터들 (202)) 에 기초하여 합성된 미드 신호 (252) 를 발생시킬 수도 있다. 신호 발생기 (274) 는 또한 합성된 미드 신호 (252) 및 ICP (208) 에 기초하여 합성된 사이드 신호 (254) 를 발생시킬 수도 있다. 특정의 구현예에서, 신호 발생기 (274) 는 합성된 사이드 신호 (254) 를 ICP (208) 와 곱하여 합성된 사이드 신호 (254) 를 발생시킨다. 다른 구현예들에서, 합성된 사이드 신호 (254) 는 합성된 미드 신호 (252), ICP (208), 및 하나 이상의 다른 값들에 기초한다. 합성된 사이드 신호 (254) 를 결정하는 추가적인 세부 사항들이 도 4 를 참조하여 설명된다. 일부 구현예들에서, 합성된 미드 신호 (252) 는 도 4 를 참조하여 추가로 설명되는 바와 같이, 합성된 사이드 신호 (254) 를 발생시키기 전에, 합성된 사이드 신호 (254) 를 발생시키는 것에 후속하여, 또는 양자로, 필터링된다.
합성된 미드 신호 (252) 및 합성된 사이드 신호 (254) 를 발생시킨 후, 디코더 (218) 는 합성된 미드 신호 (252) 및 합성된 사이드 신호 (254) 에 대해 추가적인 프로세싱, 필터링, 업샘플링, 및 업믹싱을 수행하여 제 1 오디오 신호 및 제 2 오디오 신호를 발생시킬 수도 있다. 특정의 구현예에서, 제 1 오디오 신호는 좌측 신호 또는 우측 신호 중 하나에 대응하며, 제 2 오디오 신호는 좌측 신호 또는 우측 신호 중 다른 하나에 대응한다. 제 1 오디오 신호 및 제 2 오디오 신호는 제 1 출력 신호 (226) 및 제 2 출력 신호 (228) 로서 렌더링 및 출력될 수도 있다. 특정의 구현예에서, 제 1 라우드스피커 (242) 는 제 1 출력 신호 (226) 에 기초하여 오디오 출력을 발생시키며, 제 2 라우드스피커 (244) 는 제 2 출력 신호 (228) 에 기초하여 오디오 출력을 발생시킨다.
도 2 의 시스템 (200) 은 (사이드 신호를 인코딩하는 대신) 사이드 신호를 예측한다는 결정과 연관된 프레임들에 대한 ICP (208) 의 발생 및 전송을 가능하게 한다. ICP (208) 는 디코더 (218) 가 합성된 미드 신호 (252) 에 기초하여 합성된 사이드 신호 (254) 를 예측 (예컨대, 발생) 가능하게 하기 위해 인코더 (214) 에서 발생된다. 따라서, ICP (208) 는 사이드 신호를 예측한다는 결정과 연관된 프레임들에 대한 인코딩된 사이드 신호 대신 전송된다. ICP (208) 를 전송하는 것이 인코딩된 사이드 신호를 전송하는 것보다 더 적은 비트들을 사용하기 때문에, 네트워크 리소스들이 청취자에게 비교적 눈에 띄지 않으면서 절약될 수도 있다. 대안적으로, 인코딩된 사이드 신호를 전송하는데 달리 사용될 하나 이상의 비트들이 인코딩된 미드 신호 (215) 의 추가적인 비트들을 전송하는데 대신 사용될 수도 있다. 인코딩된 미드 신호 (215) 를 전송하는데 사용되는 비트수를 증가시키는 것은 디코더 (218) 에서 발생된 합성된 미드 신호 (252) 의 품질을 향상시킨다. 추가적으로, 합성된 사이드 신호 (254) 가 합성된 미드 신호 (252) 에 기초하여 발생되기 때문에, 인코딩된 미드 신호 (215) 를 전송하는데 사용되는 비트수를 증가시키는 것은 합성된 사이드 신호 (254) 의 품질을 향상시키며, 이는 오디오 아티팩트들을 감소시키고 전체 사용자 경험을 향상시킨다.
도 3 은 도 2 의 시스템 (200) 의 인코더 (314) 의 특정의 예시적인 예를 예시하는 다이어그램이다. 예를 들어, 인코더 (314) 는 도 2 의 인코더 (214) 를 포함하거나 또는 이에 대응할 수도 있다.
인코더 (314) 는 신호 발생기 (316), 에너지 검출기 (324), ICP 발생기 (320), 및 비트스트림 발생기 (322) 를 포함한다. 신호 발생기 (316), ICP 발생기 (320), 및 비트스트림 발생기 (322) 는 도 2 의, 신호 발생기 (216), ICP 발생기 (220), 및 비트스트림 발생기 (222) 를 각각 포함하거나 또는 이에 대응할 수도 있다. 신호 발생기 (316) 는 ICP 발생기 (320), 에너지 검출기 (324), 및 비트스트림 발생기 (322) 에 커플링될 수도 있다. 에너지 검출기 (324) 는 ICP 발생기 (320) 에 커플링될 수도 있으며, ICP 발생기 (320) 는 비트스트림 발생기 (322) 에 커플링될 수도 있다.
인코더 (314) 는 옵션적으로, 하나 이상의 필터들 (331), 다운샘플러 (340), 신호 신시사이저 (342), ICP 평활기 (350), 필터 계수들 발생기 (360), 또는 이들의 조합을 포함할 수도 있다. 하나 이상의 필터들 (331) 및 다운샘플러 (340) 는 신호 발생기 (316) 와 ICP 발생기 (320) 사이에 커플링될 수도 있으며, 신호 신시사이저 (342) 는 에너지 검출기 (324) 및 ICP 발생기 (320) 에 커플링될 수도 있으며, ICP 평활기 (350) 는 ICP 발생기 (320) 와 비트스트림 발생기 (322) 사이에 커플링될 수도 있으며, 필터 계수들 발생기 (360) 는 신호 발생기 (316) 와 비트스트림 발생기 (322) 사이에 커플링될 수도 있다. 하나 이상의 필터들 (331), 다운샘플러 (340), 신호 신시사이저 (342), ICP 평활기 (350), 및 필터 계수들 발생기 (360) 의 각각은 옵션적이며, 따라서, 인코더 (314) 의 일부 구현예들에서는 포함되지 않을 수도 있다.
신호 발생기 (316) 는 입력 오디오 신호들에 기초하여 오디오 신호들을 발생시키도록 구성될 수도 있다. 예를 들어, 신호 발생기 (316) 는 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 에 기초하여 미드 신호 (311) 를 발생시키도록 구성될 수도 있다. 다른 예로서, 신호 발생기 (316) 는 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 에 기초하여 사이드 신호 (313) 를 발생시키도록 구성될 수도 있다. 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 는 도 2 의, 제 1 오디오 신호 (230) 및 제 2 오디오 신호 (232) 를 각각 포함하거나 또는 이에 대응할 수도 있다. 신호 발생기 (316) 는 또한 하나 이상의 오디오 신호들을 인코딩하도록 구성될 수도 있다. 예를 들어, 신호 발생기 (316) 는 미드 신호 (311) 에 기초하여 인코딩된 미드 신호 (315) 를 발생시키도록 구성될 수도 있다. 일부 구현예들에서, 신호 발생기 (316) 는 본원에서 추가로 설명되는 바와 같이, 사이드 신호 (313) 에 기초하여 인코딩된 사이드 신호 (317) 를 발생시키도록 구성된다.
일부 구현예들에서, 하나 이상의 필터들 (331) 은 미드 신호 (311) 및 사이드 신호 (313) 를 수신하고 미드 신호 (311) 및 사이드 신호 (313) 를 필터링하도록 구성된다. 하나 이상의 필터들 (331) 은 하나 이상의 유형들의 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (331) 은 사전-엠퍼시스 필터들, 대역통과 필터들, 고속 푸리에 변환 (FFT) 필터들 (또는, 변환들), 역 FFT (IFFT) 필터들 (또는, 변환들), 시간 도메인 필터들, 주파수 또는 서브밴드 도메인 필터들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (331) 은 고정된 사전-엠퍼시스 필터 및 50 Hertz (Hz) 고역 통과 필터를 포함한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (331) 은 저역 통과 필터 및 고역 통과 필터를 포함한다. 이 구현예에서, 하나 이상의 필터들 (331) 의 저역 통과 필터는 저-대역 미드 신호 (333) 및 저-대역 사이드 신호 (336) 를 발생시키도록 구성되며, 하나 이상의 필터들 (331) 의 고역 통과 필터는 고-대역 미드 신호 (334) 및 고-대역 사이드 신호 (338) 를 발생시키도록 구성된다. 이 구현예에서, 다수의 채널간 예측 이득 파라미터들은 본원에서 추가로 설명되는 바와 같이, 저-대역 미드 신호 (333), 고-대역 미드 신호 (334), 저-대역 사이드 신호 (336), 및 고-대역 사이드 신호 (338) 에 기초하여 결정될 수도 있다. 다른 구현예들에서, 하나 이상의 필터들 (331) 은 상이한 대역통과 필터들 (예컨대, 비한정적인 예들로서, 저역 통과 필터 및 미드 통과 필터 또는 미드 통과 필터 및 고역 통과 필터) 또는 상이한 개수의 대역통과 필터들 (예컨대, 비한정적인 예로서, 저역 통과 필터, 미드 통과 필터, 및 고역 통과 필터) 을 포함한다.
특정의 구현예에서, 다운샘플러 (340) 는 미드 신호 (311) 및 사이드 신호 (313) 를 다운샘플링하도록 구성된다. 예를 들어, 다운샘플러 (340) 는 (제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 와 연관된) 입력 샘플링 레이트로부터 미드 신호 (311) 및 사이드 신호 (313) 를 다운샘플링하도록 구성될 수도 있다. 미드 신호 (311) 및 사이드 신호 (313) 를 다운샘플링하는 것은 (입력 샘플링 레이트 대신) 다운샘플링된 레이트에서의 채널간 예측 이득 파라미터들의 발생을 가능하게 한다. 하나 이상의 필터들 (331) 의 출력에 커플링되는 것으로 도 3 에 예시되지만, 다른 구현예들에서, 다운샘플러 (340) 는 신호 발생기 (316) 와 하나 이상의 필터들 (331) 사이에 커플링될 수도 있다.
에너지 검출기 (324) 는 하나 이상의 오디오 신호들과 연관된 에너지 레벨을 검출하도록 구성된다. 예를 들어, 에너지 검출기 (324) 는 미드 신호 (311) 와 연관된 에너지 레벨 (예컨대, 미드 에너지 레벨 (326)) 및 사이드 신호 (313) 와 연관된 에너지 레벨 (예컨대, 사이드 에너지 레벨 (328)) 을 검출하도록 구성될 수도 있다. 에너지 검출기 (324) 는 사이드 에너지 레벨 (328) (또는, 사이드 에너지 레벨 (328) 및 미드 에너지 레벨 (326) 양자) 을 ICP 발생기 (320) 로 제공하도록 구성될 수도 있다.
특정의 구현예에서, 인코더 (314) 는 신호 신시사이저 (342) 를 포함한다. 신호 신시사이저 (342) 는 다른 디바이스로 (예컨대, 디코더로) 전송될 비트스트림 파라미터들을 발생시키는데 사용될 수도 있는 하나 이상의 합성된 오디오 신호들을 발생시키도록 구성될 수도 있다. 신호 신시사이저 (342) (예컨대, 로컬 디코더) 는 합성된 미드 신호 (344) 를 디코더에서의 합성된 미드 신호의 발생과 유사한 방법으로 발생시키도록 구성될 수도 있다. 예를 들어, 인코딩된 미드 신호 (315) 는 미드 신호 (311) 를 나타내는 비트스트림 파라미터들에 대응할 수도 있다. 신호 신시사이저 (342) 는 비트스트림 파라미터들을 디코딩함으로써 합성된 미드 신호 (344) 를 발생시킬 수도 있다. 합성된 미드 신호 (344) 는 에너지 검출기 (324) 로, 그리고 ICP 발생기 (320) 로 제공될 수도 있다. 특정의 구현예에서, 에너지 검출기 (324) 는 합성된 미드 신호 (344) 와 연관된 에너지 레벨 (예컨대, 합성된 미드 에너지 레벨 (329)) 을 검출하도록 추가로 구성된다. 합성된 미드 에너지 레벨 (329) 은 ICP 발생기 (320) 로 제공될 수도 있다.
ICP 발생기 (320) 는 오디오 신호들 및 오디오 신호들의 에너지 레벨들에 기초하여 하나 이상의 채널간 예측 이득 파라미터들을 발생시키도록 구성된다. 예를 들어, ICP 발생기 (320) 는 미드 신호 (311), 사이드 신호 (313), 및 하나 이상의 에너지 레벨들에 기초하여 ICP (308) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, ICP 발생기 (320) 및 ICP (308) 는 도 2 의, ICP 발생기 (220) 및 ICP (208) 를 각각 포함하거나 또는 이에 대응한다. 일부 구현예들에서, ICP 발생기 (320) 는 내적 회로부 (321) 를 포함한다. 내적 회로부 (321) 는 2개의 오디오 신호들의 내적을 발생시키도록 구성될 수도 있으며, ICP 발생기 (320) 는 본원에서 추가로 설명되는 바와 같이, 내적에 기초하여 ICP (308) 를 결정하도록 구성될 수도 있다.
특정의 구현예에서, ICP (308) 는 미드 에너지 레벨 (326) 및 사이드 에너지 레벨 (328) 에 기초한다. 이 구현예에서, ICP 발생기 (320) (예컨대, 인코더 (314)) 는 사이드 에너지 레벨 (328) 과 미드 에너지 레벨 (326) 의 비를 결정하도록 구성되며, ICP (308) 는 비에 기초한다. 다른 특정의 구현예에서, ICP (308) 는 사이드 에너지 레벨 (328) 및 합성된 미드 에너지 레벨 (329) 에 기초한다. 이 구현예에서, ICP 발생기 (320) (예컨대, 인코더 (314)) 는 사이드 에너지 레벨 (328) 과 합성된 미드 에너지 레벨 (329) 의 비를 결정하도록 구성되며, ICP (308) 는 비에 기초한다. 다른 특정의 구현예에서, ICP (308) 는 사이드 에너지 레벨 (328) 에 기초한다 (미드 에너지 레벨 (326) 또는 합성된 미드 에너지 레벨 (329) 에 기초하지 않는다). 다른 특정의 구현예에서, ICP (308) 는 미드 신호 (311), 사이드 신호 (313), 및 미드 에너지 레벨 (326) 에 기초한다. 이 구현예에서, 내적 회로부 (321) 는 미드 신호 (311) 와 사이드 신호 (313) 의 내적을 발생시키도록 구성되며, ICP 발생기 (320) 는 미드 에너지 레벨 (326) 과 내적의 비를 발생시키도록 구성되며, ICP (308) 는 비에 기초한다. 다른 특정의 구현예에서, ICP (308) 는 합성된 미드 신호 (344), 사이드 신호 (313), 및 합성된 미드 에너지 레벨 (329) 에 기초한다. 이 구현예에서, 내적 회로부 (321) 는 합성된 미드 신호 (344) 와 사이드 신호 (313) 의 내적을 발생시키도록 구성되며, ICP 발생기 (320) 는 합성된 미드 에너지 레벨 (329) 과 내적의 비를 발생시키도록 구성되며, ICP (308) 는 비에 기초한다. 다른 특정의 구현예에서, ICP 발생기 (320) 는 상이한 신호들 또는 신호 대역들에 대응하는 다수의 채널간 예측 이득 파라미터들을 발생시키도록 구성된다. 예를 들어, ICP 발생기 (320) 는 저-대역 미드 신호 (333) 및 저-대역 사이드 신호 (336) 에 기초하여 ICP (308) 를 발생시키도록 구성될 수도 있으며, ICP 발생기 (320) 는 고-대역 미드 신호 (334) 및 고-대역 사이드 신호 (338) 에 기초하여 제 2 ICP (354) 를 발생시키도록 구성될 수도 있다. ICP (308) 의 결정에 관한 추가적인 세부 사항들이 본원에서 추가로 설명된다. ICP 발생기 (320) 는 ICP (308) (및 제 2 ICP (354)) 를 비트스트림 발생기 (322) 로 제공하도록 추가로 구성될 수도 있다.
특정의 구현예에서, ICP 평활기 (350) 는 ICP (308) 가 비트스트림 발생기 (322) 로 제공되기 전에, ICP (308) 에 대해 평활화 동작을 수행하도록 구성된다. 평활화 동작은 스퓨리어스 값들을, 예컨대 특정의 프레임 경계들에서 감소시키도록 (또는, 제거하도록) ICP (308) 를 조절할 수도 있다. 평활화 동작은 평활화 인자 (352) 를 이용하여 수행될 수도 있다. 특정의 구현예에서, ICP 평활기 (350) 는 다음 수식에 따라서 평활화 동작을 수행하도록 구성될 수도 있다:
gICP_smoothed = α * gICP_smoothed (이전 프레임) + (1 - α) * gICP_instantaneous
여기서, gICP_smoothed 는 현재의 프레임에 대한 ICP (308) 의 평활화된 값이고, gICP_smoothed (이전 프레임) 는 이전 프레임에 대한 ICP (308) 의 평활화된 값이며, gICP_instantaneous 는 ICP (308) 의 순시 값이고, α 는 평활화 인자 (352) 이다.
특정의 구현예에서, 평활화 인자 (352) 는 고정된 평활화 인자이다. 예를 들어, 평활화 인자 (352) 는 ICP 평활기 (350) 에 액세스가능한 특정의 값일 수도 있다. 구체적인 예로서, 평활화 인자는 0.7 일 수도 있다. 대안적으로, 평활화 인자 (352) 는 적응적 평활화 인자일 수도 있다. 특정의 구현예에서, 적응적 평활화 인자는 미드 신호 (311) 의 신호 에너지들에 기초할 수도 있다. 예시하기 위하여, 평활화 인자 (352) 의 값은 미드 신호 (311) 및 사이드 신호 (313) 의 단기 신호 레벨 (EST) 및 장기 신호 레벨 (ELT) 에 기초할 수도 있다. 일 예로서, 단기 신호 레벨은 미드 신호 (311) 의 다운샘플링된 참조 샘플들의 절대값들의 총합과 사이드 신호 (313) 의 다운샘플링된 샘플들의 절대값들의 총합을 합산함으로써, 프로세싱중인 프레임 (N) 에 대해 계산될 수도 있다 (EST(N)). 장기 신호 레벨은 단기 신호 레벨의 평활화된 버전일 수도 있다. 예를 들어,
Figure pct00001
이다. 또, 평활화 인자 (352) (예컨대, α) 의 값은 다음과 같이 설명된 의사-코드에 따라서 제어될 수도 있다:
α 를 초기 값 (예컨대, 0.95) 로 설정한다.
EST > 4*ELT 이면, α의 값을 수정하고 (예컨대, α=0.5)
EST > 2*ELT 및 EST≤ 4*ELT 이면, α의 값을 수정한다 (예컨대, α=0.7)
미드 신호 (311) 및 사이드 신호 (313) 에 기초하여 결정되는 것으로 설명되지만, 다른 구현예들에서, 단기 신호 레벨 및 장기 신호 레벨은 합성된 미드 신호 (344) 및 사이드 신호 (313) 에 기초하여 결정될 수도 있다. 다른 특정의 구현예에서, 평활화 인자 (352) 는 미드 신호 (311) 와 연관된 보이싱 파라미터에 기초하는 적응적 평활화 인자이다. 보이싱 파라미터는 미드 신호 (311) 에서의 (또는, 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 에서의) 정지된 사운드 또는 강한 유성음 세그먼트들의 양을 표시할 수도 있다. 보이싱 파라미터가 상대적으로 높은 값을 가지면, 신호(들)는 상대적으로 낮은 잡음을 가진 강한 유성음 세그먼트들을 포함할 수도 있으며, 따라서, 평활화 인자 (352) 는 평활화가 수행되는 레이트를 감소시키도록 (예컨대, 최소화하도록) 감소될 수도 있다. 보이싱 파라미터가 상대적으로 낮은 값을 가지면, 신호(들)는 상대적으로 높은 잡음을 가진 약한 유성음 세그먼트들을 포함할 수도 있으며, 따라서, 평활화 인자 (352) 는 평활화가 수행되는 레이트를 증가시키도록 (예컨대, 최대화하도록) 증가될 수도 있다. 따라서, 일부 구현예들에서, 평활화 인자 (352) 는 보이싱 파라미터에 간접적으로 비례할 수도 있다. 다른 구현예들에서, 평활화 인자 (352) 는 다른 파라미터들 또는 값들에 기초할 수도 있다. ICP (308) 의 평활화가 설명되었지만, 제 2 ICP (354) 가 발생되는 구현예들에서, 평활화 동작은 또한 제 2 ICP (354) 에 적용될 수도 있다.
특정의 구현예에서, 디코더에서 합성된 사이드 신호를 예측하는 것은 도 4 를 참조하여 추가로 설명되는 바와 같이, 적응 필터를 합성된 미드 신호 (또는, 예측된 합성된 사이드 신호) 에 적용하는 것을 포함한다. 이 구현예에서, 인코더 (314) 는 필터 계수들 발생기 (360) 를 포함한다. 필터 계수들 발생기 (360) 는 디코더에서 적용되어야 하는 적응 필터에 대한 하나 이상의 필터 계수들 (362) 을 발생시키도록 구성될 수도 있다. 예를 들어, 필터 계수들 발생기 (360) 는 미드 신호 (311), 사이드 신호 (313), 인코딩된 미드 신호 (315), 인코딩된 사이드 신호 (317), 하나 이상의 다른 파라미터들, 또는 이들의 조합에 기초하여, 하나 이상의 필터 계수들 (362) 을 발생시키도록 구성될 수도 있다. 필터 계수들 발생기 (360) 는 인코더 (314) 에 의해 출력되는 비트스트림 파라미터들에의 포함을 위해, 하나 이상의 필터 계수들 (362) 을 비트스트림 발생기 (322) 로 제공하도록 추가로 구성될 수도 있다.
비트스트림 발생기 (322) 는 (다른 파라미터들에 추가하여) 인코딩된 오디오 신호를 표시하는 하나 이상의 비트스트림 파라미터들을 발생시키도록 구성될 수도 있다. 예를 들어, 비트스트림 발생기 (322) 는 인코딩된 미드 신호 (315) 를 포함하는 하나 이상의 비트스트림 파라미터들 (302) 을 발생시키도록 구성될 수도 있다. 하나 이상의 비트스트림 파라미터들 (302) 은 다른 파라미터들, 예컨대 피치 파라미터, 보이싱 파라미터, 코더 유형 파라미터, 저-대역 에너지 파라미터, 고-대역 에너지 파라미터, 기울기 파라미터, 피치 이득 파라미터, 고정된 코드북 (FCB) 이득 파라미터, 코딩 모드 파라미터, 보이스 활성도 파라미터, 잡음 추정 파라미터, 신호-대-잡음비 파라미터, 포르만츠 파라미터, 음성/음악 설명 파라미터, 비-인과적 시프트 파라미터, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 비트스트림 파라미터들 (302) 은 ICP (308) 를 포함한다. 대안적으로, 하나 이상의 비트스트림 파라미터들 (302) 은 ICP (308) 가 유도될 수 있게 하는 하나 이상의 파라미터들을 포함할 수도 있다 (예컨대, ICP (308) 는 하나 이상의 비트스트림 파라미터들 (302) 로부터 유도된다). 일부 구현예들에서, 하나 이상의 비트스트림 파라미터들 (302) 은 또한 제 2 ICP (354) 를 포함한다 (또는, 표시한다). 특정의 구현예에서, 하나 이상의 비트스트림 파라미터들 (302) 은 하나 이상의 필터 계수들 (362) 을 포함한다 (또는, 표시한다). 인코더 (314) 는 다른 디바이스들로의 송신을 위해, (ICP (308) 를 포함하거나 또는 표시하는) 하나 이상의 비트스트림 파라미터들 (302) 을 송신기로 출력하도록 구성될 수도 있다.
동작 동안, 인코더 (314) 는 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 를, 예컨대 하나 이상의 입력 인터페이스들로부터 수신한다. 신호 발생기 (316) 는 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 에 기초하여, 미드 신호 (311) 및 사이드 신호 (313) 를 발생시킬 수도 있다. 신호 발생기 (316) 는 또한 미드 신호 (311) 에 기초하여 인코딩된 미드 신호 (315) 를 발생시킬 수도 있다. 일부 구현예들에서, 신호 발생기 (316) 는 사이드 신호 (313) 에 기초하여 인코딩된 사이드 신호 (317) 를 발생시킬 수도 있다. 예를 들어, 인코딩된 사이드 신호 (317) 는 디코더에서 합성된 사이드 신호를 예측하지 않는다는 결정 (예컨대, 사이드 신호 (313) 를 인코딩한다는 결정) 과 연관된 하나 이상의 프레임들에 대해 발생될 수도 있다. 추가적으로, 또는 대안적으로, 인코딩된 사이드 신호 (317) 는 하나 이상의 비트스트림 파라미터들 (302) 의 발생에 사용되는 하나 이상의 파라미터들을 결정하거나 또는 하나 이상의 필터 계수들 (362) 을 결정하기 위해 발생될 수도 있다.
일부 구현예들에서, 하나 이상의 필터들 (331) 은 미드 신호 (311) 및 사이드 신호 (313) 를 필터링할 수도 있다. 예를 들어, 하나 이상의 필터들 (331) 은 미드 신호 (311) 및 사이드 신호 (313) 에 대해 사전-엠퍼시스 필터링을 수행할 수도 있다. 일부 구현예들에서, 다운샘플러 (340) 는 미드 신호 (311) 및 사이드 신호 (313) 를 다운샘플링할 수도 있다. 예를 들어, 다운샘플러 (340) 는 미드 신호 (311) 및 사이드 신호 (313) 를 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 와 연관된 입력 샘플링 주파수로부터 다운샘플링된 주파수로 다운샘플링할 수도 있다. 특정의 구현예에서, 다운샘플링된 주파수는 0 - 6.4 kHz 의 범위 내이다. 특정의 구현예에서, 다운샘플러 (340) 는 미드 신호 (311) 를 다운샘플링하여 제 1 다운샘플링된 오디오 신호 (예컨대, 다운샘플링된 미드 신호) 를 발생시킬 수도 있으며, 사이드 신호 (313) 를 다운샘플링하여 제 2 다운샘플링된 오디오 신호 (예컨대, 다운샘플링된 사이드 신호) 를 발생시킬 수도 있으며, ICP (308) 는 제 1 다운샘플링된 오디오 신호 및 제 2 다운샘플링된 오디오 신호에 기초하여 발생될 수도 있다. 대안적인 구현예에서, 다운샘플러 (340) 는 인코더 (314) 에 포함되지 않으며, ICP (308) 는 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 와 연관된 입력 샘플링 레이트에서 결정된다. 필터링 및 다운샘플링이 미드 신호 (311) 및 사이드 신호 (313) 의 발생 이후에 수행되는 것으로 도 3 을 참조하여 설명되지만, 다른 구현예들에서, 필터링, 다운샘플링, 또는 양자는 대신 (또는, 추가하여) 미드 신호 (311) 및 사이드 신호 (313) 의 발생 이전에 제 1 오디오 신호 (330) 및 제 2 오디오 신호 (332) 에 대해 수행될 수도 있다.
에너지 검출기 (324) 는 ICP (308) 를 발생시킬 때에 사용하기 위해, 하나 이상의 에너지 레벨들 연관된 하나 이상의 오디오 신호들을 검출하고 검출된 에너지 레벨들을 ICP 발생기 (320) 에 제공할 수도 있다. 예를 들어, 에너지 검출기 (324) 는 미드 에너지 레벨 (326), 사이드 에너지 레벨 (328), 합성된 미드 에너지 레벨 (329), 또는 이들의 조합을 검출할 수도 있다. 미드 에너지 레벨 (326) 은 미드 신호 (311) 에 기초하며, 사이드 에너지 레벨 (328) 은 사이드 신호 (313) 에 기초하며, 합성된 미드 에너지 레벨 (329) 은 신호 신시사이저 (342) 에 의해 발생되는 합성된 미드 신호 (344) 에 기초한다. 예를 들어, 일부 구현예들에서, 인코더 (314) 는 하나 이상의 비트스트림 파라미터들 (302) 의 하나 이상의 파라미터들을 결정하는데 사용되는 합성된 미드 신호 (344) 를 발생시키는 신호 신시사이저 (342) 를 포함한다. 이들 구현예들에서, 합성된 미드 신호 (344) 는 채널간 예측 이득 파라미터(들)를 발생시키는데 사용될 수도 있다. 다른 구현예들에서, 신호 신시사이저 (342) 는 인코더 (314) 에 포함되지 않으며, 인코더 (314) 는 합성된 미드 신호 (344) 에 액세스하지 않는다.
ICP 발생기 (320) 는 하나 이상의 신호들 및 하나 이상의 에너지 레벨들에 기초하여 ICP (308) 를 발생시킨다. 하나 이상의 신호들은 미드 신호 (311), 사이드 신호 (313), 합성된 미드 신호 (344), 또는 이들의 조합을 포함할 수도 있으며, 하나 이상의 에너지 레벨들은 미드 에너지 레벨 (326), 사이드 에너지 레벨 (328), 합성된 미드 에너지 레벨 (329), 또는 이들의 조합을 포함할 수도 있다.
일부 구현예들에서, ICP (308) 의 결정은 "에너지 기반"이다. 예를 들어, ICP (308) 는 특정의 신호의 에너지 또는 2개의 상이한 신호들의 에너지들 사이의 관계를 유지하도록 결정될 수도 있다. 제 1 특정의 구현예에서, ICP (308) 는 인코더 (314) 에서 미드 신호 (311) 와 사이드 신호 (313) 사이의 상대적인 에너지를 유지하는 스케일 인자이다. 제 1 구현예에서, ICP (308) 는 미드 에너지 레벨 (326) 과 사이드 에너지 레벨 (328) 의 비에 기초하며, ICP (308) 는 다음 수식에 따라서 결정된다:
ICP_Gain = sqrt(Energy(side_signal_unquantized)/Energy(mid_signal_unquantized))
여기서, ICP_Gain 은 ICP (308) 이고, Energy(side_signal_unquantized) 는 사이드 에너지 레벨 (328) 이며, Energy(mid_signal_unquantized) 는 미드 에너지 레벨 (326) 이다. 제 1 구현예에서, 예측된 (예컨대, 맵핑된) 합성된 사이드 신호는 다음 수식에 따라서 디코더에서 결정된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain
여기서, Side_Mapped 는 예측된 (예컨대, 맵핑된) 합성된 사이드 신호이고, ICP_Gain 은 ICP (308) 이며, Mid_signal_quantized 는 비트스트림 파라미터들 (예컨대, 하나 이상의 비트스트림 파라미터들 (302)) 에 기초하여 발생되는 합성된 미드 신호이다. Side_Mapped 가 Mid_signal_quantized 와 ICP_Gain 의 곱인 것으로 설명되지만, 다른 구현예들에서, Side_Mapped 는 중간 신호일 수도 있으며 디코더에서의 후속 동작들 (예컨대, 업믹스 동작들) 에 사용되기 전에 추가적인 프로세싱 (예컨대, 전역-통과 필터링, 디-엠퍼시스 필터링 등) 을 겪을 수도 있다.
제 2 특정의 구현예에서, ICP (308) 는 디코더에서 발생된 합성된 사이드 신호의 에너지를 인코더 (314) 에서의 사이드 에너지 레벨 (328) 에 매칭하는 스케일 인자이다. 제 2 구현예에서, ICP (308) 는 합성된 미드 에너지 레벨 (329) 과 사이드 에너지 레벨 (328) 사이의 비에 기초하며, ICP (308) 는 다음 수식에 따라서 결정된다:
ICP_Gain = sqrt(Energy(side_signal_unquantized)/Energy(mid_signal_quantized))
여기서, Energy(side_signal_unquantized) 는 사이드 에너지 레벨 (328) 이고, Energy(mid_signal_quantized) 는 합성된 미드 에너지 레벨 (329) 이며, ICP_Gain 는 ICP (308) 이다. 제 2 구현예에서, 예측된 (예컨대, 맵핑된) 합성된 사이드 신호는 다음 수식에 따라서 디코더에서 결정된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain
여기서, Side_Mapped 는 예측된 (예컨대, 맵핑된) 합성된 사이드 신호이고, ICP_Gain 은 ICP (308) 이며, Mid_signal_quantized 는 비트스트림 파라미터들에 기초하여 발생되는 합성된 미드 신호이다.
제 3 특정의 구현예에서, ICP (308) 는 인코더 (314) 에서의 사이드 에너지 레벨 (328) 의 절대값을 나타낸다. 제 3 구현예에서, ICP (308) 는 다음 수식에 따라서 결정된다:
ICP_Gain = sqrt(Energy(side_signal_unquantized))
여기서, Energy(side_signal_unquantized) 는 사이드 에너지 레벨 (328) 이다. 제 3 구현예에서, 예측된 (예컨대, 맵핑된) 합성된 사이드 신호는 다음 수식에 따라서 디코더에서 결정된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain / sqrt(Energy(Mid_signal_quantized))
여기서, Side_Mapped 는 예측된 (예컨대, 맵핑된) 합성된 사이드 신호이고, ICP_Gain 은 ICP (308) 이며, Mid_signal_quantized 는 비트스트림 파라미터들에 기초하여 발생되는 합성된 미드 신호이다.
일부 구현예들에서, ICP (308) 의 결정은 "평균 제곱 오차 (MSE) 기반" 이다. 예를 들어, ICP (308) 는 디코더에서의 합성된 사이드 신호와 사이드 신호 (313) 사이의 MSE 가 감소되도록 (예컨대, 최소화되도록) 결정될 수도 있다. 제 4 특정의 구현예에서, ICP (308) 는 미드 신호 (311) 로부터 맵핑 (예컨대, 예측) 할 때, 인코더 (314) 에서의 사이드 신호 (313) 와 디코더에서의 합성된 사이드 신호 사이의 MSE 가 최소화 (또는, 감소) 되도록, 결정된다. 제 4 구현예에서, ICP (308) 는 미드 에너지 레벨 (326) 과, 미드 신호 (311) 와 사이드 신호 (313) 의 내적의 비에 기초하며, ICP (308) 는 다음 수식에 따라서 결정된다:
Figure pct00002
여기서, ICP_Gain 은 ICP (308) 이고, |mid_signal_unquantized . Side_signal_unquantized| 는 (내적 회로부 (321) 에 의해 발생된) 미드 신호 (311) 와 사이드 신호 (313) 의 내적이며, Energy(mid_signal_unquantized) 는 미드 에너지 레벨 (326) 이다. 제 4 구현예에서, 예측된 (예컨대, 맵핑된) 합성된 사이드 신호는 다음 수식에 따라서 디코더에서 결정된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain
여기서, Side_Mapped 는 예측된 (예컨대, 맵핑된) 합성된 사이드 신호이고, ICP_Gain 은 ICP (308) 이며, Mid_signal_quantized 는 비트스트림 파라미터들에 기초하여 발생되는 합성된 미드 신호이다.
제 5 특정의 구현예에서, ICP (308) 는 합성된 미드 신호 (344) 로부터 맵핑 (예컨대, 예측) 할 때, 인코더 (314) 에서의 사이드 신호 (313) 와 디코더에서의 합성된 사이드 신호 사이의 MSE 가 최소화 (또는, 감소) 되도록, 결정된다. 제 5 구현예에서, ICP (308) 는 합성된 미드 에너지 레벨 (329) 과, 합성된 미드 신호 (344) 와 사이드 신호 (313) 의 내적의 비에 기초하며, ICP (308) 는 다음 수식에 따라서 결정된다:
Figure pct00003
여기서, ICP_Gain 은 ICP (308) 이고, |mid_signal_quantized . Side_signal_unquantized| 는 (내적 회로부 (321) 에 의해 발생된) 합성된 미드 신호 (344) 와 사이드 신호 (313) 의 내적이며, Energy(mid_signal_quantized) 는 합성된 미드 에너지 레벨 (329) 이다. 제 5 구현예에서, 예측된 (예컨대, 맵핑된) 합성된 사이드 신호는 다음 수식에 따라서 디코더에서 결정된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain
여기서, Side_Mapped 는 예측된 (예컨대, 맵핑된) 합성된 사이드 신호이고, ICP_Gain 은 ICP (308) 이며, Mid_signal_quantized 는 비트스트림 파라미터들에 기초하여 발생되는 합성된 미드 신호이다. 다른 구현예들에서, ICP (308) 는 다른 기법들을 이용하여 발생될 수도 있다.
일부 구현예들에서, ICP 평활기 (350) 는 ICP (308) 에 대해 평활화 동작을 수행한다. 평활화 동작은 평활화 인자 (352) 에 기초할 수도 있다. 평활화 인자 (352) 는 고정된 평활화 인자 또는 적응적 평활화 인자일 수도 있다. 평활화 인자 (352) 가 적응적 평활화 인자인 구현예들에서, 평활화 인자 (352) 는 비한정적인 예들로서, 미드 신호 (311) 의 신호 에너지 (예컨대, 단기 신호 레벨 및 장기 신호 레벨) 에 기초하거나 또는 미드 신호 (311) 와 연관된 보이싱 파라미터에 기초할 수도 있다. 특정의 구현예에서, ICP 평활기 (350) 는 ICP (308) 의 값을 (예컨대, 하한과 상한 사이의) 고정된 범위 내로 제한할 수도 있다. 구체적인 예로서, ICP 평활기 (350) 는 다음 의사 코드에 따라서 ICP (308) 에 대해 클리핑 동작을 수행할 수도 있다:
st_stereo->gICP_final = min(st_stereo->gICP_smoothed, 0.6)
여기서, gICP_final 은 ICP (308) 의 최종 값에 대응하며, gICP_smoothed 는 클리핑 동작의 수행 이전 ICP (308) 의 평활화된 값에 대응한다. 다른 구현예들에서, 클리핑 동작은 ICP (308) 의 값을 0.6 미만 또는 0.6 초과로 제한할 수도 있다.
일부 구현예들에서, ICP 발생기 (320) 는 또한 미드 신호 (311) 및 사이드 신호 (313) 에 기초하여 상관 파라미터를 발생시킬 수도 있다. 상관 파라미터는 미드 신호 (311) 와 사이드 신호 (313) 사이의 상관을 나타낼 수도 있다. 상관 파라미터의 발생에 관한 세부 사항들이 도 15 를 참조하여 추가로 설명된다. 상관 파라미터는 하나 이상의 비트스트림 파라미터들 (302) 에 포함시키기 위해 (또는, 하나 이상의 비트스트림 파라미터들 (302) 에 추가하여 출력하기 위해) 비트스트림 발생기 (322) 로 제공될 수도 있다. 일부 구현예들에서, ICP 평활기 (350) 는 ICP (308) 에 대해 평활화 동작을 수행하는 것과 유사한 방법으로 상관 파라미터에 대해 평활화 동작을 수행한다.
비트스트림 발생기 (322) 는 ICP (308) 및 인코딩된 미드 신호 (315) 를 수신하고 하나 이상의 비트스트림 파라미터들 (302) 을 발생시킬 수도 있다. 하나 이상의 비트스트림 파라미터들 (302) 은 인코딩된 미드 신호 (315) 를 표시할 수도 있다 (예컨대, 하나 이상의 비트스트림 파라미터들 (302) 은 디코더에서의 합성된 미드 신호의 발생을 가능하게 할 수도 있다). 하나 이상의 비트스트림 파라미터들 (302) 은 ICP (308) 를 포함할 (또는, 표시할) 수도 있다 (또는, ICP (308) 는 하나 이상의 비트스트림 파라미터들 (302) 을 추가하여 출력될 수도 있다). 특정의 구현예에서, 비트스트림 발생기 (322) 는 필터 계수들 발생기 (360) 에 의해 발생되는 하나 이상의 필터 계수들 (362) (예컨대, 하나 이상의 적응 필터 계수들) 을 수신하며, 비트스트림 발생기 (322) 는 하나 이상의 비트스트림 파라미터들 (302) 에서의 하나 이상의 필터 계수들 (362) (또는, 하나 이상의 필터 계수들 (362) 의 유도를 가능하게 하는 값들) 을 포함한다. (ICP (308) 를 포함하거나 또는 표시하는) 하나 이상의 비트스트림 파라미터들 (302) 은 도 2 를 참조하여 설명된 바와 같이, 다른 디바이스로의 송신을 위해, 인코더 (314) 에 의해 송신기로 출력될 수도 있다.
특정의 구현예에서, 다수의 채널간 예측 이득 파라미터들이 발생된다. 예시하기 위하여, 하나 이상의 필터들 (331) 은 상이한 신호 대역들을 발생시키도록 구성된 대역통과 필터들 또는 FFT 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (331) 은 미드 신호 (311) 를 프로세싱하여 저-대역 미드 신호 (333) 및 고-대역 미드 신호 (334) 를 발생시킬 수도 있다. 다른 예로서, 하나 이상의 필터들 (331) 은 사이드 신호 (313) 를 프로세싱하여 저-대역 사이드 신호 (336) 및 고-대역 사이드 신호 (338) 를 발생시킬 수도 있다. 다른 구현예들에서, 다른 신호 대역들이 발생될 수도 있거나 또는 2개보다 많은 신호 대역들이 발생될 수도 있다. 특정의 양태에서, 하나 이상의 필터들 (331) 은 제 2 필터링된 신호 (예컨대, 고-대역 미드 신호 (334) 또는 고-대역 사이드 신호 (338)) 에 대응하는 제 2 신호 대역에 적어도 부분적으로 중첩하는 제 1 신호 대역에 대응하는 제 1 필터링된 신호 (예컨대, 저-대역 미드 신호 (333) 또는 저-대역 사이드 신호 (336)) 를 발생시킨다. 대안적인 양태에서, 제 1 신호 대역은 제 2 신호 대역과 중첩하지 않는다. 다수의 신호들 (333-338) 이 ICP 발생기 (320) 로 제공될 수도 있으며, ICP 발생기 (320) 는 다수의 신호들에 기초하여 다수의 채널간 예측 이득 파라미터들을 발생시킬 수도 있다. 예를 들어, ICP 발생기 (320) 는 저-대역 미드 신호 (333) 및 저-대역 사이드 신호 (336) 에 기초하여 ICP (308) 를 발생시킬 수도 있으며, ICP 발생기 (320) 는 고-대역 미드 신호 (334) 및 고-대역 사이드 신호 (338) 에 기초하여 제 2 ICP (354) 를 발생시킬 수도 있다. ICP (308) 및 제 2 ICP (354) 는 옵션적으로, 하나 이상의 비트스트림 파라미터들 (302) 에의 포함을 위해 (또는, 하나 이상의 비트스트림 파라미터들 (302) 에 추가하여 출력을 위해), 평활화되어 비트스트림 발생기 (322) 로 제공될 수도 있다. 다수의 ICP 값들을 발생시키는 것은 상이한 이득들이 상이한 대역들에서 적용될 수 있게 할 수도 있으며, 이는 디코더에서의 합성된 사이드 신호의 전체 예측을 향상시킬 수도 있다. 구체적인 예로서, 사이드 신호 (313) 는 저-대역에서 전체 에너지 (예컨대, 미드 신호 (311) 의 에너지와 사이드 신호 (313) 의 에너지의 총합) 의 20% 에 대응할 수도 있으며, 그러나, 고-대역에서 전체 에너지의 60% 에 대응할 수도 있다. 따라서, ICP (308) 에 기초하여 사이드 신호의 저-대역을 합성하고 제 2 ICP (354) 에 기초하여 사이드 신호의 고-대역을 합성하는 것은 모든 신호 대역들에 대한 하나의 채널간 예측 이득 파라미터에 기초하여 사이드 신호를 합성하는 것보다 더 정확한 합성된 사이드 신호를 초래할 수도 있다.
도 3 의 인코더 (314) 는 (사이드 신호를 인코딩하는 대신) 디코더에서 사이드 신호를 예측한다는 결정과 연관된 프레임들에 대한 채널간 예측 이득 파라미터들의 발생을 가능하게 한다. 채널간 예측 이득 파라미터 (예컨대, ICP (308)) 는 디코더로 하여금, 인코더 (314) 에서 발생된 하나 이상의 비트스트림 파라미터들에 기초하여 발생되는 합성된 미드 신호에 기초하여, 합성된 사이드 신호를 예측 (예컨대, 발생) 가능하게 하기 위해, 인코더 (314) 에서 발생된다. ICP (308) 가 인코딩된 사이드 신호 (317) 의 프레임 대신 출력되기 때문에, 그리고 ICP (308) 가 인코딩된 사이드 신호 (317) 보다 더 적은 비트들을 사용하기 때문에, 네트워크 리소스들은 청취자에게 비교적 눈에 띄지 않으면서 절약될 수도 있다. 대안적으로, 인코딩된 사이드 신호 (317) 를 출력하는데 달리 사용될 하나 이상의 비트들이 대신, 인코딩된 미드 신호 (315) 의 추가적인 비트들을 출력하기 위해 용도 변경될 (예컨대, 사용될) 수도 있다. 인코딩된 미드 신호 (315) 를 출력하는데 사용되는 비트수를 증가시키는 것은 인코더 (314) 에 의해 출력되는 인코딩된 미드 신호 (315) 와 연관된 정보의 양을 증가시킨다. 인코더 (314) 에 의해 출력되는 인코딩된 미드 신호 (315) 의 비트수를 증가시키는 것은 디코더에서 발생된 합성된 미드 신호의 품질을 향상시킬 수도 있으며, 이는 디코더에서의 합성된 미드 신호에서의 (그리고, 합성된 사이드 신호가 합성된 미드 신호에 기초하여 예측되므로, 디코더에서의 합성된 사이드 신호에서의) 오디오 아티팩트들을 감소시킬 (또는, 제거할) 수도 있다.
도 4 는 도 2 의 시스템 (200) 의 디코더 (418) 의 특정의 예시적인 예를 예시하는 다이어그램이다. 예를 들어, 디코더 (418) 는 도 2 의 디코더 (218) 를 포함하거나 또는 이에 대응할 수도 있다.
디코더 (418) 는 미드 신시사이저 (452) 및 사이드 신시사이저 (456) 를 포함하는 신호 발생기 (450), 및 비트스트림 프로세싱 회로부 (424) 를 포함한다. 신호 발생기 (450) 는 도 2 의 신호 발생기 (274) 를 포함하거나 또는 이에 대응할 수도 있다. 비트스트림 프로세싱 회로부 (424) 는 신호 발생기 (450) 에 커플링될 수도 있다.
디코더 (418) 는 옵션적으로, 에너지 검출기 (460) 및 업샘플러 (464) 를 포함할 수도 있으며, 신호 발생기 (450) 는 옵션적으로, 하나 이상의 필터들 (454) 및 하나 이상의 필터들 (458) 을 포함할 수도 있다. 하나 이상의 필터들 (454) 은 미드 신시사이저 (452) 와 사이드 신시사이저 (456) 사이에 커플링될 수도 있으며, 하나 이상의 필터들 (458) 은 사이드 신시사이저 (456) 에 커플링될 수도 있으며, 업샘플러 (464) 는 신호 발생기 (450) 에 (예컨대, 신호 발생기 (450) 의 출력에) 커플링될 수도 있으며, 에너지 검출기 (460) 는 미드 신시사이저 (452) 에 그리고 사이드 신시사이저 (456) 에 커플링될 수도 있다. 하나 이상의 필터들 (454), 하나 이상의 필터들 (458), 업샘플러 (464), 및 에너지 검출기 (460) 의 각각은 옵션적이며, 따라서, 디코더 (418) 의 일부 구현예들에서는 포함되지 않을 수도 있다.
비트스트림 프로세싱 회로부 (424) 는 비트스트림 파라미터들을 프로세싱하여, 비트스트림 파라미터들로부터 특정의 파라미터들을 추출하도록 구성될 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 을 (예컨대, 수신기로부터) 수신하도록 구성될 수도 있다. 하나 이상의 비트스트림 파라미터들 (402) 은 채널간 예측 이득 파라미터 (ICP) (408) 를 포함할 (또는, 표시할) 수도 있다. 대안적으로, ICP (408) 는 하나 이상의 비트스트림 파라미터들 (402) 에 추가하여 수신될 수도 있다. 하나 이상의 비트스트림 파라미터들 (402) 및 ICP (408) 는 도 3 의, 하나 이상의 비트스트림 파라미터들 (302) 및 ICP (308) 를 각각 포함하거나 또는 이에 대응할 수도 있다. 일부 구현예들에서, 하나 이상의 비트스트림 파라미터들 (402) 은 또한 하나 이상의 계수들 (406) 을 포함할 (또는, 표시할) 수도 있다. 하나 이상의 계수들 (406) 은 인코더 (예컨대, 비한정적인 예로서, 도 3 의 인코더 (314)) 에 의해 발생되는 하나 이상의 적응 필터 계수들을 포함할 수도 있다.
비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 로부터 하나 이상의 특정의 파라미터들을 추출하도록 구성될 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (424) 는 ICP (408) 및 하나 이상의 인코딩된 미드 신호 파라미터들 (426) 을 추출하도록 (예컨대, 발생시키도록) 구성될 수도 있다. 하나 이상의 인코딩된 미드 신호 파라미터들 (426) 은 인코더에서 발생되는 인코딩된 오디오 신호 (예컨대, 인코딩된 미드 신호) 를 표시하는 파라미터들을 포함한다. 하나 이상의 인코딩된 미드 신호 파라미터들 (426) 은 본원에서 추가로 설명되는 바와 같이, 합성된 미드 신호의 발생을 가능하게 할 수도 있다. 비트스트림 프로세싱 회로부 (424) 는 ICP (408) 및 하나 이상의 인코딩된 미드 신호 파라미터들 (426) 을 신호 발생기 (450) 로 (예컨대, 미드 신시사이저 (452) 로) 제공하도록 구성될 수도 있다. 특정의 구현예에서, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 계수들 (406) 을 추출하여, 하나 이상의 계수들 (406) 을 신호 발생기 (450) 로 (예컨대, 하나 이상의 필터들 (454), 하나 이상의 필터들 (458), 또는 양자로) 제공하도록 추가로 구성된다.
신호 발생기 (450) 는 인코딩된 미드 신호 파라미터들 (426) 및 ICP (408) 에 기초하여 오디오 신호들을 발생시키도록 구성될 수도 있다. 예시하기 위하여, 미드 신시사이저 (452) 는 인코딩된 미드 신호 파라미터들 (426) 에 기초하여 (예컨대, 인코딩된 미드 신호에 기초하여) 합성된 미드 신호 (470) 를 발생시키도록 구성될 수도 있다. 예를 들어, 인코딩된 미드 신호 파라미터들 (426) 은 합성된 미드 신호 (470) 의 유도를 가능하게 할 수도 있으며, 미드 신시사이저 (452) 는 인코딩된 미드 신호 파라미터들 (426) 로부터 합성된 미드 신호 (470) 를 유도하도록 구성될 수도 있다. 합성된 미드 신호 (470) 는 제 2 오디오 신호 상에 중첩된 제 1 오디오 신호를 나타낼 수도 있다.
특정의 구현예에서, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 를 수신하고 합성된 미드 신호 (470) 를 필터링하도록 구성된다. 하나 이상의 필터들 (454) 은 하나 이상의 유형들의 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (454) 은 디-엠퍼시스 필터들, 대역통과 필터들, FFT 필터들 (또는, 변환들), IFFT 필터들 (또는, 변환들), 시간 도메인 필터들, 주파수 또는 서브밴드 도메인 필터들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (454) 은 하나 이상의 고정된 필터들을 포함한다. 대안적으로, 하나 이상의 필터들 (454) 은 계수들 (406) (예컨대, 다른 디바이스로부터 수신된 하나 이상의 적응 필터 계수들) 에 기초하여 합성된 미드 신호 (470) 를 필터링하도록 구성된 하나 이상의 적응 필터들을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (454) 은 디-엠퍼시스 필터 및 50 Hz 고역 통과 필터를 포함한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (454) 은 저역 통과 필터 및 고역 통과 필터를 포함하며, 이 구현예에서, 하나 이상의 필터들 (454) 의 저역 통과 필터는 저-대역 합성된 미드 신호 (474) 를 발생시키도록 구성되며, 하나 이상의 필터들 (454) 의 고역 통과 필터는 고-대역 합성된 미드 신호 (473) 를 발생시키도록 구성된다. 이 구현예에서, 다수의 채널간 예측 이득 파라미터들이 본원에서 추가로 설명되는 바와 같이, 다수의 합성된 사이드 신호들을 예측하는데 사용될 수도 있다. 다른 구현예들에서, 하나 이상의 필터들 (454) 은 상이한 대역통과 필터들 (예컨대, 비한정적인 예들로서, 저역 통과 필터 및 미드 통과 필터 또는 미드 통과 필터 및 고역 통과 필터) 또는 상이한 개수의 대역통과 필터들 (예컨대, 비한정적인 예로서, 저역 통과 필터, 미드 통과 필터, 및 고역 통과 필터) 을 포함한다.
사이드 신시사이저 (456) 는 합성된 미드 신호 (470) 및 ICP (408) 에 기초하여 합성된 사이드 신호 (472) 를 발생시키도록 구성될 수도 있다. 예를 들어, 사이드 신시사이저 (456) 는 ICP (408) 를 합성된 미드 신호 (470) 에 적용하여 합성된 사이드 신호 (472) 를 발생시키도록 구성될 수도 있다. 합성된 사이드 신호 (472) 는 제 1 오디오 신호와 제 2 오디오 신호 사이의 차이를 나타낼 수도 있다. 특정의 구현예에서, 사이드 신시사이저 (456) 는 합성된 미드 신호 (470) 를 ICP (408) 로 곱하여 합성된 사이드 신호 (472) 를 발생시키도록 구성될 수도 있다. 다른 특정의 구현예에서, 사이드 신시사이저 (456) 는 합성된 미드 신호 (470), ICP (408), 및 합성된 미드 신호 (470) 의 에너지 레벨 (예컨대, 합성된 미드 에너지 (462)) 에 기초하여 합성된 사이드 신호 (472) 를 발생시키도록 구성될 수도 있다. 합성된 미드 에너지 (462) 는 에너지 검출기 (460) 로부터 사이드 신시사이저 (456) 에서 수신될 수도 있다. 예를 들어, 에너지 검출기 (460) 는 합성된 미드 신호 (470) 를 미드 신시사이저 (452) 로부터 수신하도록 구성될 수도 있으며, 에너지 검출기 (460) 는 합성된 미드 신호 (470) 로부터 합성된 미드 에너지 (462) 를 검출하도록 구성될 수도 있다. 다른 특정의 구현예에서, 사이드 신시사이저 (456) 는 다수의 채널간 예측 이득 파라미터들에 기초하여 다수의 사이드 신호들 (또는, 신호 대역들) 을 발생시키도록 구성될 수도 있다. 예를 들어, 사이드 신시사이저 (456) 는 저-대역 합성된 미드 신호 (474) 및 ICP (408) 에 기초하여 저-대역 합성된 사이드 신호 (476) 를 발생시키도록 구성될 수도 있으며, 사이드 신시사이저 (456) 는 고-대역 합성된 미드 신호 (473) 및 제 2 ICP (예컨대, 도 3 의 제 2 ICP (354)) 에 기초하여 고-대역 합성된 사이드 신호 (475) 를 발생시키도록 구성될 수도 있다.
특정의 구현예에서, 하나 이상의 필터들 (458) 은 합성된 사이드 신호 (472) 를 수신하고 합성된 사이드 신호 (472) 를 필터링하도록 구성된다. 하나 이상의 필터들 (458) 은 하나 이상의 유형들의 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (458) 은 디-엠퍼시스 필터들, 대역통과 필터들, FFT 필터들 (또는, 변환들), IFFT 필터들 (또는, 변환들), 시간 도메인 필터들, 주파수 또는 서브밴드 도메인 필터들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (458) 은 하나 이상의 고정된 필터들을 포함한다. 대안적으로, 하나 이상의 필터들 (458) 은 계수들 (406) (예컨대, 다른 디바이스로부터 수신된 하나 이상의 적응 필터 계수들) 에 기초하여 합성된 사이드 신호 (472) 를 필터링하도록 구성된 하나 이상의 적응 필터들을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (458) 은 디-엠퍼시스 필터 및 50 Hz 고역 통과 필터를 포함한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (458) 은 다수의 신호들 (또는, 신호 대역들) 을 결합하여 합성된 신호를 발생시키도록 구성된 결합 필터 (또는, 다른 신호 결합기) 를 포함한다. 예를 들어, 하나 이상의 필터들 (458) 은 고-대역 합성된 사이드 신호 (475) 와 저-대역 합성된 사이드 신호 (476) 를 결합하여 합성된 사이드 신호 (472) 를 발생시키도록 구성될 수도 있다. 합성된 사이드 신호(들) 에 대해 필터링을 수행하는 것으로 설명되지만, 다른 구현예들 (예컨대, 하나 이상의 필터들 (454) 을 포함하지 않는 구현예들) 에서, 하나 이상의 필터들 (458) 은 또한 합성된 미드 신호(들) 에 대해 필터링을 수행하도록 구성될 수도 있다.
특정의 구현예에서, 업샘플러 (464) 는 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 를 업샘플링하도록 구성된다. 예를 들어, 업샘플러 (464) 는 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 를 (합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 가 발생되는) 다운샘플링된 레이트로부터 업샘플링된 레이트 (예컨대, 인코더에서 수신되고 하나 이상의 비트스트림 파라미터들 (402) 을 발생시키는데 사용되는 오디오 신호들의 입력 샘플링 레이트) 로 업샘플링하도록 구성될 수도 있다. 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 를 업샘플링하는 것은오디오 신호들의 플레이백과 연관된 출력 샘플링 레이트에서의 오디오 신호들의 (예컨대, 디코더 (418) 에 의한) 발생을 가능하게 한다.
디코더 (418) 는 업샘플링된 합성된 미드 신호 (470) 및 업샘플링된 합성된 사이드 신호 (472) 에 기초하여 제 1 오디오 신호 (480) 및 제 2 오디오 신호 (482) 를 발생시키도록 구성될 수도 있다. 예를 들어, 디코더 (418) 는 도 1 의 디코더 (118) 를 참조하여 설명된 바와 같이, 업믹싱 파라미터에 기초하여, 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 의 업믹싱을 수행하여, 제 1 오디오 신호 (480) 및 제 2 오디오 신호 (482) 를 발생시킬 수도 있다.
동작 동안, 디코더 (418) 는 하나 이상의 비트스트림 파라미터들 (402) 을 (예컨대, 수신기로부터) 수신한다. 하나 이상의 비트스트림 파라미터들 (402) 은 ICP (408) 를 포함한다 (또는, 표시한다). 일부 구현예들에서, 하나 이상의 비트스트림 파라미터들 (402) 은 또한 계수들 (406) 을 포함한다 (또는, 표시한다). 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 을 프로세싱하고 다양한 파라미터들을 추출할 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 로부터 인코딩된 미드 신호 파라미터들 (426) 을 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (424) 는 인코딩된 미드 신호 파라미터들 (426) 을 신호 발생기 (450) 로 (예컨대, 미드 신시사이저 (452) 로) 제공할 수도 있다. 다른 예로서, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 로부터 ICP (408) 를 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (424) 는 ICP (408) 를 신호 발생기 (450) 로 (예컨대, 사이드 신시사이저 (456) 로) 제공할 수도 있다. 특정의 구현예에서, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 비트스트림 파라미터들 (402) 로부터 하나 이상의 계수들 (406) 을 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (424) 는 하나 이상의 계수들 (406) 을 신호 발생기 (450) 로 (예컨대, 하나 이상의 필터들 (454) 로, 하나 이상의 필터들 (458) 로, 또는 양자로) 제공할 수도 있다.
미드 신시사이저 (452) 는 인코딩된 미드 신호 파라미터들 (426) 에 기초하여, 합성된 미드 신호 (470) 를 발생시킬 수도 있다. 일부 구현예들에서, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 를 필터링할 수도 있다. 예를 들어, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 에 대해 디-엠퍼시스 필터링, 고역 통과 필터링, 또는 양자를 수행할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (454) 은 (합성된 사이드 신호 (472) 의 발생 전에) 고정된 필터를 합성된 미드 신호 (470) 에 적용한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (454) 은 (예컨대, 합성된 사이드 신호 (472) 의 발생 전에) 적응 필터를 합성된 미드 신호 (470) 에 적용한다. 적응 필터는 다른 디바이스로부터 (예컨대, 하나 이상의 비트스트림 파라미터들 (402) 에의 포함을 통해) 수신된 하나 이상의 계수들 (406) 에 기초할 수도 있다.
사이드 신시사이저 (456) 는 합성된 미드 신호 (470) 및 ICP (408) 에 기초하여 합성된 사이드 신호 (472) 를 발생시킬 수도 있다. 합성된 사이드 신호 (472) 가 (다른 디바이스로부터 수신된 인코딩된 사이드 신호 파라미터들에 기초하는 대신) 합성된 미드 신호 (470) 에 기?파여 발생되기 때문에, 합성된 사이드 신호 (472) 를 발생시키는 것은 합성된 미드 신호 (470) 로부터 합성된 사이드 신호 (472) 를 예측 (또는, 맵핑) 하는 것으로서 지칭될 수도 있다. 일부 구현예들에서, 합성된 사이드 신호 (472) 는 다음 수식에 따라서 발생될 수도 있다:
Side_Mapped = Mid_signal_quantized * ICP_Gain
여기서, Side_Mapped 는 합성된 사이드 신호 (472) 이고, ICP_Gain 은 ICP (408) 이고, Mid_signal_quantized 는 합성된 미드 신호 (470) 이다. 이와 같이 합성된 사이드 신호 (472) 를 발생시키는 것은 도 3 을 참조하여 설명된 바와 같이, ICP (308) 를 발생시키는 제 1, 제 2, 제 4, 및 제 5 구현예들에 대응한다.
다른 특정의 구현예에서, 합성된 사이드 신호 (472) 는 다음 수식에 따라서 발생된다:
Side_Mapped = Mid_signal_quantized * ICP_Gain / sqrt(Energy(Mid_signal_quantized))
여기서, Side_Mapped 는 합성된 사이드 신호 (472) 이고, ICP_Gain 은 ICP (408) 이며, Mid_signal_quantized 는 합성된 미드 신호 (470) 이고, Energy(Mid_signal_quantized) 는 에너지 검출기 (460) 에 의해 발생되는 합성된 미드 에너지 (462) 이다.
특정의 구현예에서, 다른 디바이스의 인코더는 어느 기법이 합성된 사이드 신호 (472) 를 발생시키는데 사용되어야 하는지를 표시하기 위해 하나 이상의 비트스트림 파라미터들 (402) 에 하나 이상의 비트들을 포함시킬 수도 있다. 예를 들어, 특정의 비트가 제 1 값 (예컨대, 로직 "0" 값) 을 가지면, 합성된 사이드 신호 (472) 는 합성된 미드 신호 (470) 및 ICP (408) 에 기초하여 발생될 수도 있으며, 특정의 비트가 제 2 값 (예컨대, 로직 "1" 값) 을 가지면, 합성된 사이드 신호 (472) 는 합성된 미드 신호 (470), ICP (408), 및 합성된 미드 에너지 (462) 에 기초하여 발생될 수도 있다. 다른 구현예들에서, 디코더 (418) 는 다른 정보, 예컨대 하나 이상의 비트스트림 파라미터들 (402) 에 포함된 하나 이상의 다른 파라미터들에 기초하여 또는 ICP (408) 의 값에 기초하여, 합성된 사이드 신호 (472) 를 발생시킬 방법을 결정할 수도 있다.
일부 구현예에서, 합성된 사이드 신호 (472) 는 중간 합성된 사이드 신호를 포함하거나 또는 이에 대응할 수도 있으며, 추가적인 프로세싱 (예컨대, 전역-통과 필터링, 대역-통과 필터링, 다른 필터링, 업샘플링, 등) 이 업믹싱하는데 사용되는 최종 합성된 사이드 신호를 발생시키기 위해 중간 합성된 사이드 신호에 대해 수행될 수도 있다. 특정의 구현예에서, 중간 합성된 사이드 신호에 대해 수행되는 전역-통과 필터링은 하나 이상의 비트스트림 파라미터들 (402) 에 포함되는 (또는, 추가하여 수신되는) 상관 파라미터에 기초하여 제어된다. 상관 파라미터에 기초하여 전역-통과 필터링을 수행하는 것은 합성된 미드 신호 (470) 와 최종 합성된 사이드 신호 사이의 상관을 감소시킬 (예컨대, 비상관을 증가시킬) 수도 있다. 상관 파라미터에 기초하여 중간 합성된 사이드 신호를 필터링하는 세부 사항들이 도 15 를 참조하여 설명된다.
일부 구현예들에서, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 를 필터링할 수도 있다. 예를 들어, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 에 대해 디-엠퍼시스 필터링, 고역 통과 필터링, 또는 양자를 수행할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (454) 은 (합성된 사이드 신호 (472) 의 발생 전에) 고정된 필터를 합성된 미드 신호 (470) 에 적용한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (454) 은 (예컨대, 합성된 사이드 신호 (472) 의 발생 전에) 적응 필터를 합성된 미드 신호 (470) 에 적용한다. 적응 필터는 다른 디바이스로부터 (예컨대, 하나 이상의 비트스트림 파라미터들 (402) 에의 포함을 통해서) 수신된 하나 이상의 계수들 (406) 에 기초할 수도 있다.
일부 구현예들에서, 하나 이상의 필터들 (458) 은 합성된 사이드 신호 (472) 를 필터링할 수도 있다. 예를 들어, 하나 이상의 필터들 (458) 은 합성된 사이드 신호 (472) 에 대해 디-엠퍼시스 필터링, 고역 통과 필터링, 또는 양자를 수행할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (458) 은 고정된 필터를 합성된 사이드 신호 (472) 에 적용한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (458) 은 적응 필터를 합성된 사이드 신호 (472) 에 적용한다. 적응 필터는 다른 디바이스로부터 (예컨대, 하나 이상의 비트스트림 파라미터들 (402) 에의 포함을 통해서) 수신된 하나 이상의 계수들 (406) 에 기초할 수도 있다. 일부 구현예들에서, 하나 이상의 필터들 (454) 은 디코더 (418) 에 포함되지 않으며, 하나 이상의 필터들 (458) 은 합성된 사이드 신호 (472) 및 합성된 미드 신호 (470) 에 대해 필터링을 수행한다.
일부 구현예들에서, 업샘플러 (464) 는 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 를 업샘플링할 수도 있다. 예를 들어, 업샘플러 (464) 는 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 를 다운샘플링된 레이트 (예컨대, 대략 0 - 6.4 kHz) 로부터 출력 샘플링 레이트로 업샘플링할 수도 있다. 업샘플링 후, 디코더 (418) 는 합성된 미드 신호 (470) 및 합성된 사이드 신호 (472) 에 기초하여 제 1 오디오 신호 (480) 및 제 2 오디오 신호 (482) 를 발생시킬 수도 있다. 제 1 오디오 신호 (480) 및 제 2 오디오 신호 (482) 는 하나 이상의 출력 디바이스들, 예컨대 하나 이상의 라우드스피커들로 출력될 수도 있다. 특정의 구현예에서, 제 1 오디오 신호 (480) 는 좌측 오디오 신호 및 우측 오디오 신호 중 하나이고, 제 2 오디오 신호 (482) 는 좌측 오디오 신호 및 우측 오디오 신호 중 다른 하나이다.
특정의 구현예에서, 다수의 채널간 예측 이득 파라미터들이 다수의 신호들 (또는, 신호 대역들) 을 발생시키는데 사용된다. 예시하기 위하여, 하나 이상의 필터들 (454) 은 상이한 신호 대역들을 발생시키도록 구성된 대역통과 또는 FFT 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 를 프로세싱하여 저-대역 합성된 미드 신호 (474) 및 고-대역 합성된 미드 신호 (473) 를 발생시킬 수도 있다. 다른 구현예들에서, 다른 신호 대역들이 발생될 수도 있거나 또는 2개보다 많은 신호 대역들이 발생될 수도 있다. 사이드 신시사이저 (456) 는 다수의 채널간 예측 이득 파라미터들에 기초하여 다수의 합성된 신호들 (또는, 신호 대역들) 을 발생시킬 수도 있다. 예를 들어, 사이드 신시사이저 (456) 는 저-대역 합성된 미드 신호 (474) 및 ICP (408) 에 기초하여 저-대역 합성된 사이드 신호 (476) 를 발생시킬 수도 있다. 다른 예로서, 사이드 신시사이저 (456) 는 고-대역 합성된 미드 신호 (473) 및 (예컨대, 하나 이상의 비트스트림 파라미터들 (402) 에 포함되거나 또는 이에 의해 표시되는) 제 2 ICP 에 기초하여, 고-대역 합성된 사이드 신호 (475) 를 발생시킬 수도 있다. 하나 이상의 필터들 (458) (또는, 다른 신호 결합기) 은 저-대역 합성된 사이드 신호 (476) 와 고-대역 합성된 사이드 신호 (475) 를 결합하여 합성된 사이드 신호 (472) 를 발생시킬 수도 있다. 상이한 채널간 예측 이득 파라미터들을 상이한 신호 대역들에 적용하는 것은 모든 신호 대역들과 연관된 단일 채널간 예측 이득 파라미터에 기초하여 발생되는 합성된 사이드 신호보다 인코더에서의 사이드 신호에 더 가깝게 매칭하는 합성된 사이드 신호를 초래할 수도 있다.
도 4 의 디코더 (418) 는 (인코딩된 사이드 신호를 수신하는 대신) 디코더 (418) 에서 사이드 신호를 예측한다는 결정과 연관된 프레임들에 대한 채널간 예측 이득 파라미터들 (예컨대, ICP (408)) 을 이용한 합성된 미드 신호 (470) 로부터의 합성된 사이드 신호 (472) 의 예측 (예컨대, 맵핑) 을 가능하게 한다. ICP (408) 가 인코딩된 사이드 신호의 프레임 대신 디코더 (418) 로 전송되기 때문에, 그리고 ICP (408) 가 인코딩된 사이드 신호보다 더 적은 비트들을 이용하기 때문에, 네트워크 리소스들은 청취자에게 비교적 눈에 띄지 않으면서 절약될 수도 있다. 대안적으로, 인코딩된 사이드 신호를 전송하는데 달리 사용될 하나 이상의 비트들이 인코딩된 미드 신호의 추가적인 비트들을 전송하도록 대신 용도 변경될 (예컨대, 사용될) 수도 있다. 수신되는 인코딩된 미드 신호의 비트수를 증가시키는 것은 디코더 (418) 에 의해 수신되는 인코딩된 미드 신호와 연관된 정보의 양을 증가시킨다. 디코더 (418) 에 의해 수신되는 인코딩된 미드 신호의 비트수를 증가시키는 것은 합성된 미드 신호 (470) 의 품질을 향상시킬 수도 있으며, 이는 합성된 미드 신호 (470) 에서의 (및 합성된 사이드 신호 (472) 가 합성된 미드 신호 (470) 에 기초하여 예측되므로 합성된 사이드 신호 (472) 에서의) 오디오 아티팩트들을 감소시킬 (또는, 제거할) 수도 있다.
도 5 내지 도 6, 및 도 9 는 CP 파라미터 (109) 를 발생시키는 추가적인 예들을 예시한다. 도 1 은 CP 선택기 (122) 가 ICA 파라미터들 (107) 에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된 예를 예시한다. 도 5 는 CP 선택기 (122) 가 다운믹스 파라미터, 하나 이상의 다른 파라미터들, 또는 이들의 조합에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된 예를 예시한다. 도 6 은 CP 선택기 (122) 가 채널간 예측 이득 파라미터에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된 예를 예시한다. 도 9 는 CP 선택기 (122) 가 ICA 파라미터들 (107), 다운믹스 파라미터, 채널간 예측 이득 파라미터, 하나 이상의 다른 파라미터들, 또는 이들의 조합에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된 예를 예시한다.
도 5 를 참조하면, 인코더 (114) 의 일 예가 도시된다. CP 선택기 (122) 는 다운믹스 파라미터 (515), 하나 이상의 다른 파라미터들 (517) (예컨대, 스테레오 파라미터들), 또는 이들의 조합에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된다.
동작 동안, 채널간 정렬기 (108) 는 도 1 을 참조하여 설명된 바와 같이, 참조 신호 (103) 및 조정된 목표 신호 (105) 를 미드사이드 발생기 (148) 로 제공한다. 미드사이드 발생기 (148) 는 참조 신호 (103) 및 조정된 목표 신호 (105) 를 다운믹싱함으로써 미드 신호 (511) 및 사이드 신호 (513) 를 발생시킨다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, 다운믹스 파라미터 (515) 에 기초하여 참조 신호 (103) 및 조정된 목표 신호 (105) 를 다운믹싱한다. 특정의 양태에서, 다운믹스 파라미터 (515) 는 디폴트 값 (예컨대, 0.5) 에 대응한다. 특정의 양태에서, 다운믹스 파라미터 (515) 는 참조 신호 (103) 및 조정된 목표 신호 (105) 에 기초하는 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, 다른 파라미터들 (517) 을 발생시킬 수도 있다. 예를 들어, 다른 파라미터들 (517) 은 음성 결정 파라미터, 과도 표시자, 코어 유형, 또는 코더 유형 중 적어도 하나를 포함할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 CP 파라미터 (509) 를 미드사이드 발생기 (148) 로 제공한다. 특정의 양태에서, CP 파라미터 (509) 는 인코딩된 사이드 신호가 송신을 위해 발생되어야 한다는 것, 합성된 사이드 신호가 인코딩된 사이드 신호를 디코딩함으로써 발생되어야 한다는 것, 또는 양자를 표시하는 디폴트 값 (예컨대, 0) 을 갖는다. CP 파라미터 (509) 는 다운믹스 파라미터 (515) 를 결정하는데 사용되는 중간 파라미터에 대응할 수도 있다. 예를 들어, 본원에서 설명된 바와 같이, 다운믹스 파라미터 (515) (예컨대, 중간 다운믹스 파라미터) 는 미드 신호 (511) (예컨대, 중간 미드 신호), 사이드 신호 (513) (예컨대, 중간 사이드 신호), 다른 파라미터들 (519) (예컨대, 중간 파라미터들), 또는 이들의 조합을 결정하는데 사용될 수도 있다. 다운믹스 파라미터 (515), 다른 파라미터들 (519), 또는 이들의 조합이 CP 파라미터 (109) (예컨대, 최종 CP 파라미터) 를 결정하는데 사용될 수도 있다. CP 파라미터 (109) 는 다운믹스 파라미터 (115) (예컨대, 최종 다운믹스 파라미터) 를 결정하는데 사용될 수도 있다. 다운믹스 파라미터 (115) 는 미드 신호 (111) (예컨대, 최종 미드 신호), 사이드 신호 (113) (예컨대, 최종 사이드 신호), 또는 양자를 결정하는데 사용된다.
미드사이드 발생기 (148) 는 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 이들의 조합을, CP 선택기 (122) 로 제공한다. CP 선택기 (122) 는 도 9 를 참조하여 추가로 설명되는 바와 같이, 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 이들의 조합에 기초하여 CP 파라미터 (109) 를 결정한다. CP 선택기 (122) 는 CP 파라미터 (109) 를 미드사이드 발생기 (148), 신호 발생기 (116), 또는 양자로 제공한다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, CP 파라미터 (109) 에 기초하여 다운믹스 파라미터 (115) 를 발생시킨다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, 다운믹스 파라미터 (115) 에 기초하여 미드 신호 (111), 사이드 신호 (113), 또는 양자를 발생시킨다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 추가로 설명되는 바와 같이, 다른 파라미터들 (519) (예컨대, 중간 파라미터들) 을 결정한다.
특정의 양태에서, 미드사이드 발생기 (148) 는, CP 파라미터 (109) 가 CP 파라미터 (509) 와 매칭한다 (예컨대, 동일하다) 고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) 를 다운믹스 파라미터 (515) 와 동일한 값을 갖도록 설정하고, 미드 신호 (511) 를 미드 신호 (111) 로서 지정하고, 사이드 신호 (513) 를 사이드 신호 (113) 로서 지정하고, 다른 파라미터들 (517) 을 다른 파라미터들 (519) 로서 지정하고, 또는 이들의 조합을 행한다. 미드사이드 발생기 (148) 는 미드 신호 (111), 사이드 신호 (113), 다운믹스 파라미터 (115), 또는 이들의 조합을, 신호 발생기 (116) 로 제공한다. 신호 발생기 (116) 는 도 1 을 참조하여 설명된 바와 같이, CP 파라미터 (109), 다운믹스 파라미터 (115), 미드 신호 (111), 사이드 신호 (113), 또는 이들의 조합에 기초하여 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 발생시킨다. 송신기 (110) 는 도 1 을 참조하여 설명된 바와 같이, 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 다른 파라미터들 (517) 의 하나 이상, 또는 이들의 조합을 송신한다. CP 선택기 (122) 는 따라서 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 이들의 조합에 기초하여 CP 파라미터 (109) 를 결정하는 것을 가능하게 한다.
도 6 을 참조하면, 인코더 (114) 의 일 예가 도시된다. 인코더 (114) 는 채널간 예측 이득 (GICP) 발생기 (612) 를 포함한다. 특정의 양태에서, GICP 발생기 (612) 는 도 2 의 ICP 발생기 (220) 에 대응한다. 예를 들어, GICP 발생기 (612) 는 ICP 발생기 (220) 를 참조하여 설명된 하나 이상의 동작들을 수행하도록 구성된다. CP 선택기 (122) 는 GICP (601) (예컨대, 채널간 예측 이득 값) 에 기초하여 CP 파라미터 (109) 를 결정하도록 구성된다.
동작 동안, 채널간 정렬기 (108) 는 도 1 을 참조하여 설명된 바와 같이, 참조 신호 (103) 및 조정된 목표 신호 (105) 를 미드사이드 발생기 (148) 로 제공한다. 미드사이드 발생기 (148) 는 도 5 를 참조하여 설명된 바와 같이, CP 파라미터 (509) 에 기초하여, 미드 신호 (511) 및 사이드 신호 (513) 를 발생시킨다. 미드사이드 발생기 (148) 는 미드 신호 (511) 및 사이드 신호 (513) 를 GICP 발생기 (612) 로 제공한다. GICP 발생기 (612) 는 도 2 의 ICP 발생기 (220) 를 참조하여 설명된 바와 같이, 미드 신호 (511) 및 사이드 신호 (513) 에 기초하여 GICP (601) 를 발생시킨다. 예를 들어, 미드 신호 (511) 는 도 2 의 미드 신호 (211) 에 대응할 수도 있으며, 사이드 신호 (513) 는 도 2 의 사이드 신호 (213) 에 대응할 수도 있으며, GICP (601) 는 도 2 의 ICP (208) 에 대응할 수도 있다. 일부 구현예들에서, GICP (601) 는 미드 신호 (511) 의 에너지 및 사이드 신호 (513) 의 에너지에 기초할 수도 있다. GICP (601) 는 CP 파라미터 (109) (예컨대, 최종 CP 파라미터) 를 결정하는데 사용되는 중간 파라미터에 대응할 수도 있다. 예를 들어, 본원에서 설명된 바와 같이, CP 파라미터 (109) 는 다운믹스 파라미터 (115) (예컨대, 최종 다운믹스 파라미터) 를 결정하는데 사용될 수도 있다. 다운믹스 파라미터 (115) 는 미드 신호 (111) (예컨대, 최종 미드 신호), 사이드 신호 (113) (예컨대, 최종 사이드 신호), 또는 양자를 결정하는데 사용될 수도 있다. 미드 신호 (111), 사이드 신호 (113), 또는 양자는 GICP (603) (예컨대, 최종 GICP) 를 결정하는데 사용될 수도 있다. GICP (603) 는 도 1 의 제 2 디바이스 (106) 로 송신될 수도 있다.
GICP 발생기 (612) 는 GICP (601) 를 CP 선택기 (122) 로 제공한다. CP 선택기 (122) 는 도 9 를 참조하여 추가로 설명되는 바와 같이, GICP (601) 에 기초하여 CP 파라미터 (109) 를 결정한다. CP 선택기 (122) 는 CP 파라미터 (109) 를 미드사이드 발생기 (148) 로 제공한다. 미드사이드 발생기 (148) 는 도 8 을 참조하여 설명된 바와 같이, CP 파라미터 (109) 에 기초하여, 미드 신호 (111) 및 사이드 신호 (113) 를 발생시킨다. 미드사이드 발생기 (148) 는 미드 신호 (111) 및 사이드 신호 (113) 를 GICP 발생기 (612) 로 제공한다. GICP 발생기 (612) 는 도 2 의 ICP 발생기 (220) 를 참조하여 추가로 설명된 바와 같이, 미드 신호 (111) 및 사이드 신호 (113) 에 기초하여 GICP (603) 를 발생시킨다. 예를 들어, 미드 신호 (111) 는 도 2 의 미드 신호 (211) 에 대응할 수도 있으며, 사이드 신호 (113) 는 도 2 의 사이드 신호 (213) 에 대응할 수도 있으며, GICP (603) 는 도 2 의 ICP (208) 에 대응할 수도 있다. 일부 구현예들에서, GICP (603) 는 미드 신호 (111) 의 에너지 및 사이드 신호 (113) 의 에너지에 기초할 수도 있다.
특정의 양태에서, 미드사이드 발생기 (148) 는, CP 파라미터 (109) 가 CP 파라미터 (509) 와 매칭한다 (예컨대, 동일하다) 고 결정하는 것에 응답하여, 미드 신호 (511) 를 미드 신호 (111) 로서 지정하고, 사이드 신호 (513) 를 사이드 신호 (113) 로서 지정하고, GICP (601) 를 GICP (603) 로서 지정하거나, 또는 이들의 조합을 수행한다. 미드사이드 발생기 (148) 는 미드 신호 (111), 사이드 신호 (113), 또는 양자를 신호 발생기 (116) 로 제공한다. 신호 발생기 (116) 는 도 1 을 참조하여 설명된 바와 같이, CP 파라미터 (109) 에 기초하여 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자를 발생시킨다. 특정의 양태에서, 도 1 의 송신기 (110) 는 GICP (603), 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 이들의 조합을 송신한다. 예를 들어, 도 1 의 코딩 파라미터들 (140) 은 GICP (603) 를 포함할 수도 있다. 도 1 의 비트스트림 파라미터들 (102) 은 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자에 대응할 수도 있다.
특정의 양태에서, 도 2 의 송신기 (210) 는 GICP (603), 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 이들의 조합을 송신한다. 예를 들어, GICP (603) 는 도 2 의 ICP (208) 에 대응한다. 도 2 의 비트스트림 파라미터들 (202) 은 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자에 대응할 수도 있다. CP 선택기 (122) 는 따라서 GICP (601) 에 기초하여 CP 파라미터 (109) 를 결정하는 것을 가능하게 한다.
도 7 을 참조하면, 채널간 정렬기 (108) 의 일 예가 도시된다. 채널간 정렬기 (108) 는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여 참조 신호 (103), 조정된 목표 신호 (105), ICA 파라미터들 (107), 또는 이들의 조합을 발생시키도록 구성된다. 본원에서 사용될 때, "채널간 정렬기" 는 "시간 등화기" 로서 지칭될 수도 있다. 채널간 정렬기 (108) 는 리샘플러 (704), 신호 비교기 (706), 내삽기 (710), 시프트 정제기 (711), 시프트 변화 분석기 (712), 절대 시간 부정합 발생기 (716), 참조 신호 지정기 (708), 이득 파라미터 발생기 (714), 또는 이들의 조합을 포함할 수도 있다.
동작 동안, 리샘플러 (704) 는 하나 이상의 리샘플링된 신호들을 발생시킬 수도 있다. 예를 들어, 리샘플러 (704) 는 1 이상일 수도 있는 리샘플링 인자 (D) 에 기초하여 제 1 오디오 신호 (130) 를 리샘플링함으로써 제 1 리샘플링된 신호 (730) 를 발생시킬 수도 있다. 리샘플러 (704) 는 리샘플링 인자 (D) 에 기초하여 제 2 오디오 신호 (132) 를 리샘플링함으로써 제 2 리샘플링된 신호 (732) 를 발생시킬 수도 있다. 리샘플러 (704) 는 제 1 리샘플링된 신호 (730), 제 2 리샘플링된 신호 (732), 또는 양자를, 신호 비교기 (706) 에 제공할 수도 있다.
신호 비교기 (706) 는 비교 값들 (734) (예컨대, 차이 값들, 유사도 값들, 코히어런스 값들, 또는 교차-상관 값들), 임시 시간 부정합 값 (701), 또는 이들의 조합을 발생시킬 수도 있다. 예를 들어, 신호 비교기 (706) 는 제 1 리샘플링된 신호 (730), 및 제 2 리샘플링된 신호 (732) 에 적용되는 복수의 시간 부정합 값들에 기초하여 비교 값들 (734) 을 발생시킬 수도 있다. 신호 비교기 (706) 는 비교 값들 (734) 에 기초하여 임시 시간 부정합 값 (701) 을 결정할 수도 있다. 예를 들어, 임시 시간 부정합 값 (701) 은 비교 값들 (734) 의 다른 값들보다 더 높은 상관 (또는, 더 낮은 차이) 을 표시하는 선택된 비교 값에 대응할 수도 있다. 신호 비교기 (706) 는 비교 값들 (734), 임시 시간 부정합 값 (701), 또는 양자를 내삽기 (710) 로 제공할 수도 있다.
내삽기 (710) 는 임시 시간 부정합 값 (701) 을 확장할 수도 있다. 예를 들어, 내삽기 (710) 는 내삽된 시간 부정합 값 (703) 을 발생시킬 수도 있다. 예시하기 위하여, 내삽기 (710) 는 비교 값들 (734) 을 내삽함으로써 임시 시간 부정합 값 (701) 에 근사한 시간 부정합 값들에 대응하는 내삽된 비교 값들을 발생시킬 수도 있다. 내삽기 (710) 는 내삽된 비교 값들 및 비교 값들 (734) 에 기초하여, 내삽된 시간 부정합 값 (703) 을 결정할 수도 있다. 비교 값들 (734) 은 시간 부정합 값들의 더 조악한 그래뉼래러티에 기초할 수도 있다. 예를 들어, 비교 값들 (734) 은 제 1 서브세트의 제 1 시간 부정합 값과 제 1 서브세트의 각각의 제 2 시간 부정합 값 사이의 차이가 임계치 이상 (예컨대, ≥1) 이 되도록, 시간 부정합 값들의 세트의 제 1 서브세트에 기초할 수도 있다. 임계치는 리샘플링 인자 (D) 에 기초할 수도 있다.
내삽된 비교 값들은 임시 시간 부정합 값 (701) 에 근접한 시간 부정합 값들의 더 미세한 그래뉼래러티에 기초할 수도 있다. 예를 들어, 내삽된 비교 값들은 제 2 서브세트의 최고 시간 부정합 값과 임시 시간 부정합 값 (701) 사이의 차이가 임계치 미만 (예컨대, <1) 이 되도록, 그리고 제 2 서브세트의 최저 시간 부정합 값과 임시 시간 부정합 값 (701) 사이의 차이가 임계치 미만이 되도록, 시간 부정합 값들의 세트의 제 2 서브세트에 기초할 수도 있다. 내삽기 (710) 는 내삽된 시간 부정합 값 (703) 을 시프트 정제기 (711) 로 제공할 수도 있다.
시프트 정제기 (711) 는 내삽된 시간 부정합 값 (703) 을 정제함으로써, 정정된 시간 부정합 값 (705) 을 발생시킬 수도 있다. 예를 들어, 시프트 정제기 (711) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합에서의 변화가 시간 부정합 임계치보다 크다는 것을 내삽된 시간 부정합 값 (703) 이 표시하는지 여부를 결정할 수도 있다. 시간 부정합에서의 변화는 내삽된 시간 부정합 값 (703) 과 이전에 인코딩된 프레임과 연관된 제 1 시간 부정합 값 사이의 차이에 의해 표시될 수도 있다. 시프트 정제기 (711) 는 차이가 임계치 이하라고 결정하는 것에 응답하여, 정정된 시간 부정합 값 (705) 을 내삽된 시간 부정합 값 (703) 으로 설정할 수도 있다. 대안적으로, 시프트 정제기 (711) 는 차이가 임계치보다 크다고 결정하는 것에 응답하여, 시간 부정합 변화 임계치 이하인 차이에 대응하는 복수의 시간 부정합 값들을 결정할 수도 있다. 시프트 정제기 (711) 는 제 2 오디오 신호 (132) 에 적용되는 복수의 시간 부정합 값들 및 제 1 오디오 신호 (130) 에 기초하여 비교 값들을 결정할 수도 있다. 시프트 정제기 (711) 는 비교 값들에 기초하여, 정정된 시간 부정합 값 (705) 을 결정할 수도 있다. 시프트 정제기 (711) 는 선택된 시간 부정합 값을 표시하도록, 정정된 시간 부정합 값 (705) 을 설정할 수도 있다. 시프트 정제기 (711) 는 정정된 시간 부정합 값 (705) 을 시프트 변화 분석기 (712) 로 제공할 수도 있다.
시프트 변화 분석기 (712) 는 정정된 시간 부정합 값 (705) 이 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 타이밍에서의 스위치 또는 역전을 표시하는지 여부를 결정할 수도 있다. 특히, 타이밍에서의 역전 또는 스위치는 제 1 프레임 (예컨대, 이전에 인코딩된 프레임) 에 대해, 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 이전에 입력 인터페이스(들) (112) 에서 수신되고, 그리고, 후속 프레임에 대해, 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 이전에 입력 인터페이스(들) (112) 에서 수신된다는 것을 표시할 수도 있다. 대안적으로, 타이밍에서의 역전 또는 스위치는 제 1 프레임에 대해, 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 이전에 입력 인터페이스(들) (112) 에서 수신되고, 그리고, 후속 프레임에 대해, 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 이전에 입력 인터페이스(들) (112) 에서 수신된다는 것을 표시할 수도 있다. 다시 말해서, 타이밍에서의 스위치 또는 역전은 제 1 프레임에 대응하는 제 1 시간 부정합 값 (예컨대, 최종 시간 부정합 값) 이 후속 프레임에 대응하는 정정된 시간 부정합 값 (705) 의 제 2 부호와는 상이한 제 1 부호를 갖는다는 것을 표시할 수도 있다 (예컨대, 양에서 음으로의 전이 또는 그 반대). 시프트 변화 분석기 (712) 는 정정된 시간 부정합 값 (705) 및 제 1 프레임과 연관된 제 1 시간 부정합 값에 기초하여, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였는지 여부를 결정할 수도 있다. 시프트 변화 분석기 (712) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다고 결정하는 것에 응답하여, 최종 시간 부정합 값 (707) 을 시간 시프트 없음을 표시하는 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, 시프트 변화 분석기 (712) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하지 않았다고 결정하는 것에 응답하여, 최종 시간 부정합 값 (707) 을 정정된 시간 부정합 값 (705) 으로 설정할 수도 있다. 시프트 변화 분석기 (712) 는 정정된 시간 부정합 값 (705) 을 정제함으로써, 추정된 시간 부정합 값을 발생시킬 수도 있다. 시프트 변화 분석기 (712) 는 최종 시간 부정합 값 (707) 을 추정된 시간 부정합 값으로 설정할 수도 있다. 시간 시프트 없음을 표시하도록 최종 시간 부정합 값 (707) 을 설정하는 것은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 를 제 1 오디오 신호 (130) 의 연속된 (또는, 인접한) 프레임들에 대해 대향 방향들로 시간 시프트시키는 것을 억제함으로써, 디코더에서의 왜곡을 감소시킬 수도 있다. 시프트 변화 분석기 (712) 는 최종 시간 부정합 값 (707) 을 절대 시간 부정합 발생기 (716) 로, 그리고 참조 신호 지정기 (708) 로 제공할 수도 있다.
절대 시간 부정합 발생기 (716) 는 절대 함수를 최종 시간 부정합 값 (707) 에 적용함으로써 비-인과적 시간 부정합 값 (717) 을 발생시킬 수도 있다. 절대 시간 부정합 발생기 (716) 는 비-인과적 시간 부정합 값 (162) 을 이득 파라미터 발생기 (714) 로 제공할 수도 있다.
참조 신호 지정기 (708) 는 참조 신호 표시자 (719) 를 발생시킬 수도 있다. 예를 들어, 참조 신호 지정기 (708) 는 최종 시간 부정합 값 (707) 이 특정의 임계치 (예컨대, 0) 를 만족시킨다 (예컨대, 이보다 크다) 고 결정하는 것에 응답하여, 참조 신호 표시자 (719) 를 제 1 값 (예컨대, 1) 을 갖도록 설정할 수도 있다. 대안적으로, 참조 신호 표시자 (719) 는 최종 시간 부정합 값 (707) 이 특정의 임계치 (예컨대, 0) 를 만족시키지 못한다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, 참조 신호 표시자 (719) 를 제 2 값 (예컨대, 0) 을 갖도록 설정할 수도 있다. 특정의 양태에서, 참조 신호 지정기 (708) 는 최종 시간 부정합 값 (707) 이 시간 부정합 없음을 표시하는 특정의 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 이전에 인코딩된 프레임에 대응하는 값으로부터 참조 신호 표시자 (719) 를 변경하는 것을 억제할 수도 있다. 참조 신호 표시자 (719) 는 제 1 오디오 신호 (130) 가 참조 신호 (103) 로서 지정된다는 것을 표시하는 제 1 값 또는 제 2 오디오 신호 (132) 가 참조 신호 (103) 로서 지정된다는 것을 표시하는 제 2 값을 가질 수도 있다. 참조 신호 지정기 (708) 는 참조 신호 표시자 (719) 를 이득 파라미터 발생기 (714) 에 제공할 수도 있다.
이득 파라미터 발생기 (714) 는 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 하나가 참조 신호 (103) 에 대응한다는 것을 참조 신호 표시자 (719) 가 표시한다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 다른 하나가 목표 신호에 대응한다고 결정할 수도 있다. 이득 파라미터 발생기 (714) 는 비-인과적 시간 부정합 값 (717) 에 기초하여 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 의 샘플들을 선택할 수도 있다. 본원에서 인용될 때, 시간 부정합 값에 기초하여 오디오 신호의 샘플들을 선택하는 것은 시간 부정합 값에 기초하여 오디오 신호를 조정 (예컨대, 시프트) 하고 조정된 오디오 신호의 샘플들을 선택함으로써, 조정된 (예컨대, 시간-시프트된) 오디오 신호를 발생시키는 것에 대응할 수도 있다. 예를 들어, 이득 파라미터 발생기 (714) 는 비-인과적 시간 부정합 값 (717) 에 기초하여 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 의 샘플들을 선택함으로써 조정된 목표 신호 (105) (예컨대, 시간-시프트된 제 2 오디오 신호) 를 발생시킬 수도 있다.
이득 파라미터 발생기 (714) 는 참조 신호 (103) 의 샘플들 및 조정된 목표 신호의 선택된 샘플들에 기초하여 ICA 이득 파라미터 (709) (예컨대, 채널간 이득 파라미터) 를 발생시킬 수도 있다. 예를 들어, 이득 파라미터 발생기 (714) 는 다음 수식들 중 하나에 기초하여 ICA 이득 파라미터 (709) 를 발생시킬 수도 있다:
Figure pct00004
수식 6a
Figure pct00005
수식 6b
Figure pct00006
수식 6c
Figure pct00007
수식 6d
Figure pct00008
수식 6e
Figure pct00009
수식 6f
여기서, gD 는 다운믹스 프로세싱을 위한 ICA 이득 파라미터 (709) 에 대응하며, Ref(n) 는 참조 신호 (103) 의 샘플들에 대응하며, N1 은 비-인과적 시간 부정합 값 (717) 에 대응하며, Targ(n+N1) 는 조정된 목표 신호 (105) 의 선택된 샘플들에 대응한다. 일부 구현예들에서, 이득 파라미터 발생기 (714) 는 참조 신호 표시자 (719) 와 관계없이, 제 1 오디오 신호 (130) 를 참조 신호로서 처리하는 것 및 제 2 오디오 신호 (132) 를 목표 신호로서 처리하는 것에 기초하여, ICA 이득 파라미터 (709) 를 발생시킬 수도 있다. ICA 이득 파라미터 (709) 는 참조 신호 (104) 의 제 1 샘플들의 제 1 에너지와 조정된 목표 신호 (105) 의 선택된 샘플들의 제 2 에너지의 에너지 비에 대응할 수도 있다.
ICA 이득 파라미터 (709) (gD) 는 프레임들 사이의 이득에서의 큰 점프들을 회피하기 위해 장기 평활화/히스테리시스 로직을 통합하도록 수정될 수도 있다. 예를 들어, 이득 파라미터 발생기 (714) 는 ICA 이득 파라미터 (709) 및 제 1 ICA 이득 파라미터 (715) 에 기초하여 평활화된 ICA 이득 파라미터 (713) (예컨대, 평활화된 채널간 이득 파라미터) 를 발생시킬 수도 있다. 제 1 ICA 이득 파라미터 (715) 는 이전에 인코딩된 프레임에 대응할 수도 있다. 예시하기 위하여, 이득 파라미터 발생기 (714) 는 ICA 이득 파라미터 (709) 와 제 1 ICA 이득 파라미터 (715) 의 평균에 기초하여 평활화된 ICA 이득 파라미터 (713) 를 발생시킬 수도 있다. ICA 파라미터들 (107) 은 임시 시간 부정합 값 (701), 내삽된 시간 부정합 값 (703), 정정된 시간 부정합 값 (705), 최종 시간 부정합 값 (707), 비-인과적 시간 부정합 값 (717), 제 1 ICA 이득 파라미터 (715), 평활화된 ICA 이득 파라미터 (713), ICA 이득 파라미터 (709), 또는 이들의 조합 중 적어도 하나를 포함할 수도 있다.
도 8 을 참조하면, 미드사이드 발생기 (148) 의 일 예가 도시된다. 미드사이드 발생기 (148) 는 다운믹스 파라미터 발생기 (802) 를 포함한다. 다운믹스 파라미터 발생기 (802) 는 CP 파라미터 (809) 에 기초하여 다운믹스 파라미터 (803) 를 발생시키도록 구성된다. 특정의 양태에서, CP 파라미터 (809) 는 도 1 의 CP 파라미터 (109) 에 대응하며 다운믹스 파라미터 (803) 는 도 1 의 다운믹스 파라미터 (115) 에 대응한다. 특정의 양태에서, CP 파라미터 (809) 는 도 5 의 CP 파라미터 (509) 에 대응하며 다운믹스 파라미터 (803) 는 도 5 의 다운믹스 파라미터 (515) 에 대응한다.
다운믹스 파라미터 발생기 (802) 는 파라미터 발생기 (806) 에 커플링된 다운믹스 발생 결정기 (804) 를 포함한다. 다운믹스 발생 결정기 (804) 는 제 1 기법 또는 제 2 기법이 다운믹스 파라미터 (803) 를 발생시키는데 사용되어야 하는지 여부를 표시하는 다운믹스 발생 결정 (895) 을 발생시키도록 구성된다.
파라미터 발생기 (806) 는 제 1 기법을 이용하여 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 파라미터 발생기 (806) 는 제 2 기법을 이용하여 다운믹스 파라미터 값 (807) 을 발생시키도록 구성된다. 파라미터 발생기 (806) 는 다운믹스 발생 결정 (895) 에 기초하여, 다운믹스 파라미터 값 (805) 또는 다운믹스 파라미터 값 (807) 을 다운믹스 파라미터 (803) 로서 지정하도록 구성된다. 2개의 다운믹스 파라미터 값들 (805 및 807) 을 발생시키는 것으로서 설명되지만, 다른 구현예들에서, 단지 (예컨대, 다운믹스 발생 결정 (895) 에 기초한) 선택된 다운믹스 파라미터 값만이 발생된다.
미드사이드 발생기 (148) 는 다운믹스 파라미터 (803) 에 기초하여 미드 신호 (811) 및 사이드 신호 (813) 를 발생시키도록 구성된다. 특정의 양태에서, 미드 신호 (811) 및 사이드 신호 (813) 는 도 1 의, 미드 신호 (111) 및 사이드 신호 (113) 에 각각 대응한다. 특정의 양태에서, 미드 신호 (811) 및 사이드 신호 (813) 는 도 5 의, 미드 신호 (511) 및 사이드 신호 (513) 에 각각 대응한다.
동작 동안, 다운믹스 발생 결정기 (804) 는, CP 파라미터 (809) 가 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 발생 결정 (895) 을 제 1 기법이 다운믹스 파라미터 (803) 를 발생시키는데 사용되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 으로 설정한다. CP 파라미터 (809) 의 제 2 값 (예컨대, 1) 은 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다는 것, 및 도 1 의 합성된 사이드 신호 (173) 가 도 1 의 디코더 (118) 에서 예측되어야 한다는 것을 표시할 수도 있다. 다른 예로서, 다운믹스 발생 결정기 (804) 는, CP 파라미터 (809) 가 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 발생 결정 (895) 을 제 2 기법이 다운믹스 파라미터 (803) 를 발생시키는데 사용되어야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖도록 설정한다. CP 파라미터 (809) 의 제 1 값 (예컨대, 0) 은 사이드 신호 (113) 가 송신을 위해 인코딩되어야 한다는 것 및 도 1 의 합성된 사이드 신호 (173) 가 디코더 (118) 에서 인코딩된 사이드 신호 (123) 를 디코딩함으로써 결정되어야 한다는 것을 표시할 수도 있다. 다운믹스 발생 결정기 (804) 는 다운믹스 발생 결정 (895) 을 파라미터 발생기 (806) 로 제공한다.
파라미터 발생기 (806) 는, 다운믹스 발생 결정 (895) 이 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 제 1 기법을 이용하여 다운믹스 파라미터 값 (805) 을 발생시킨다. 예를 들어, 파라미터 발생기 (806) 는 다운믹스 파라미터 값 (805) 을 디폴트 값 (예컨대, 0.5) 으로서 발생시킨다. 파라미터 발생기 (806) 는 다운믹스 파라미터 값 (805) 을 다운믹스 파라미터 (803) 로서 지정한다. 대안적으로, 파라미터 발생기 (806) 는, 다운믹스 발생 결정 (895) 이 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 제 2 기법을 이용하여 다운믹스 파라미터 값 (807) 을 발생시킨다. 예를 들어, 파라미터 발생기 (806) 는 참조 신호 (103) 및 조정된 목표 신호 (105) 에 기초하여, 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한 다운믹스 파라미터 값 (807) 을 발생시킨다. 예시하기 위하여, 파라미터 발생기 (806) 는 참조 신호 (103) 의 제 1 특성의 제 1 값과 조정된 목표 신호 (105) 의 제 1 특성의 제 2 값의 비교에 기초하여 다운믹스 파라미터 값 (807) 을 결정할 수도 있다. 예를 들어, 제 1 특성은 신호 에너지 또는 신호 상관에 대응할 수도 있다. 파라미터 발생기 (806) 는 제 1 값과 제 2 값 사이의 특성 비교 값 (예컨대, 차이) 에 기초하여 다운믹스 파라미터 값 (807) 을 결정할 수도 있다.
특정의 양태에서, 파라미터 발생기 (806) 는 제 1 범위 값 (예컨대, 0) 내지 제 2 범위 값 (예컨대, 1) 의 범위 내에 있도록 다운믹스 파라미터 값 (807) 을 발생시키도록 구성된다. 예를 들어, 파라미터 발생기 (806) 는 특성 비교 값을 그 범위 이내의 값에 맵핑한다. 본 양태에서, 특정의 값 (예컨대, 0.5) 을 갖는 다운믹스 파라미터 값 (807) 은 참조 신호 (103) 의 제 1 에너지가 조정된 목표 신호 (105) 의 제 2 에너지와 대략 동일하다는 것을 표시할 수도 있다. 파라미터 발생기 (806) 는 특성 비교 값 (예컨대, 차이) 이 임계치 (예컨대, 허용오차 레벨) 를 만족시킨다 (예컨대, 미만이다) 고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) 이 특정의 값 (예컨대, 0.5) 을 갖는다고 결정할 수도 있다. 참조 신호 (103) 의 제 1 에너지가 조정된 목표 신호 (105) 의 제 2 에너지보다 더 클수록, 다운믹스 파라미터 값 (807) 은 제 1 범위 값 (예컨대, 0) 에 더 가까워질 수도 있다. 조정된 목표 신호 (105) 의 제 2 에너지가 참조 신호 (103) 의 제 1 에너지보다 더 클 수록, 다운믹스 파라미터 값 (807) 은 제 2 범위 값 (예컨대, 1) 에 더 가까워질 수도 있다. 파라미터 발생기 (806) 는, 다운믹스 발생 결정 (895) 이 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) 을 다운믹스 파라미터 (803) 로서 지정된다.
특정의 양태에서, 파라미터 발생기 (806) 는 디폴트 값 (예컨대, 0.5), 다운믹스 파라미터 값 (807), 또는 양자에 기초하여 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 예를 들어, 파라미터 발생기 (806) 는 디폴트 값 (예컨대, 0.5) 의 특정의 범위 내에 있도록 다운믹스 파라미터 값 (807) 을 수정함으로써 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 특정의 양태에서, 파라미터 발생기 (806) 는 다운믹스 파라미터 값 (807) 이 제 1 특정의 값 미만이라고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (805) 을 제 1 특정의 값 (예컨대, 0.3) 으로 설정하도록 구성된다. 대안적으로, 파라미터 발생기 (806) 는 다운믹스 파라미터 값 (807) 이 제 2 특정의 값보다 크다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (805) 을 제 2 특정의 값 (예컨대, 0.7) 으로 설정하도록 구성된다. 특정의 양태에서, 파라미터 발생기 (806) 는 동적 범위 감소 함수 (예컨대, 수정된 S자형) 를 다운믹스 파라미터 값 (807) 에 적용함으로써 다운믹스 파라미터 값 (805) 을 발생시킨다.
특정의 양태에서, 파라미터 발생기 (806) 는 디폴트 값 (예컨대, 0.5), 다운믹스 파라미터 값 (807), 또는 하나 이상의 추가적인 파라미터들에 기초하여 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 예를 들어, 파라미터 발생기 (806) 는 보이싱 인자 (825) 에 기초하여 다운믹스 파라미터 값 (807) 을 수정함으로써 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 예시하기 위하여, 파라미터 발생기 (806) 는 다음 수식에 기초하여 다운믹스 파라미터 값 (805) 을 발생시킬 수도 있다:
Ratio_L = (vf) * 0.5 + (1 - vf) * original_Ratio_L 수식 7
여기서, Ratio_L 은 다운믹스 파라미터 값 (805) 에 대응하며, vf 는 보이싱 인자 (825) 에 대응하며, original_Ratio_L 은 다운믹스 파라미터 값 (807) 에 대응한다. 보이싱 인자 (825) 는 특정의 범위 (예컨대, 0.0 내지 1.0) 내에 있을 수도 있다. 보이싱 인자 (825) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자의 유성음/무성음 성질 (예컨대, 강한 유성음 (strongly voiced), 약한 유성음 (weakly voiced), 약한 무성음, 또는 강한 무성음) 을 표시할 수도 있다. 보이싱 인자 (825) 는 ACELP 코어에 의해 결정된 보이싱 인자들의 평균에 대응할 수도 있다.
특정의 예에서, 파라미터 발생기 (806) 는 비교 값 (855) 에 기초하여 다운믹스 파라미터 값 (807) 을 수정함으로써 다운믹스 파라미터 값 (805) 을 발생시키도록 구성된다. 예를 들어, 파라미터 발생기 (806) 는 다음 수식에 기초하여 다운믹스 파라미터 값 (805) 을 발생시킬 수도 있다:
Ratio_L = (ica_crosscorrelation) * 0.5 + (1 - ica_crosscorrelation) * original_Ratio_L 수식 8
여기서, Ratio_L 은 다운믹스 파라미터 값 (805) 에 대응하며, ica_crosscorrelation 은 비교 값 (855) 에 대응하며, original_Ratio_L 은 다운믹스 파라미터 값 (807) 에 대응한다. 미드 사이드 발생기 (148) 는 참조 신호 (103) 의 샘플들과 조정된 목표 신호 (105) 의 선택된 샘플들의 비교에 기초하여 비교 값 (855) (예컨대, 차이 값, 유사도 값, 코히어런스 값, 또는 교차-상관 값) 을 결정할 수도 있다.
미드사이드 발생기 (148) 는 다운믹스 파라미터 (803) 에 기초하여 미드 신호 (811) 및 사이드 신호 (813) 를 발생시킨다. 예를 들어, 미드사이드 발생기 (148) 는 다음 수식들의 쌍들에 기초하여 미드 신호 (811) 및 사이드 신호 (813) 를 발생시킨다:
Mid(n) = Ratio_L * L(n) + (1 - Ratio_L) * R(n) 수식 9(a)
Side(n) = (1 - Ratio_L) * L(n) - (Ratio_L) * R(n) 수식 9(b)
Mid(n) = Ratio_L * L(n) + (1-Ratio_L) * R(n) 수식 10(a)
Side(n) = 0.5 * L(n) - 0.5 * R(n) 수식 10(b)
Mid(n) = 0.5 * L(n) + 0.5 * R(n) 수식 11(a)
Side(n) = (1 - Ratio_L) * L(n) - (Ratio_L) * R(n) 수식 11(b)
여기서, Mid(n) 은 미드 신호 (811) 에 대응하며, Side(n) 은 사이드 신호 (813) 에 대응하며, L(n) 은 제 1 오디오 신호 (130) 의 샘플들에 대응하며, R(n) 은 제 2 오디오 신호 (132) 의 샘플들에 대응하며, Ratio_L 은 다운믹스 파라미터 (803) 에 대응한다. 특정의 양태에서, L(n) 은 참조 신호 (103) 의 샘플들에 대응하며, R(n) 은 조정된 목표 신호 (105) 의 대응하는 샘플들에 대응한다. 대안적인 양태에서, R(n) 은 참조 신호 (103) 의 샘플들에 대응하며, L(n) 은 조정된 목표 신호 (105) 의 대응하는 샘플들에 대응한다.
특정의 양태에서, 미드사이드 발생기 (148) 는 다음 수식들의 쌍들에 기초하여 미드 신호 (811) 및 사이드 신호 (813) 를 발생시킨다:
Mid(n) = Ratio_L * Ref(n) + (1 - Ratio_L) * Targ(n+N1) 수식 12(a)
Side(n) = (1 - Ratio_L) * Ref(n) - (Ratio_L) * Targ(n+N1) 수식 12(b)
Mid(n) = Ratio_L * Ref(n) + (1-Ratio_L) * Targ(n+N1) 수식 13(a)
Side(n) = 0.5 * Ref(n) - 0.5 * Targ(n+N1) 수식 13(b)
Mid(n) = 0.5 * Ref(n) + 0.5 * Targ(n+N1) 수식 14(a)
Side(n) = (1 - Ratio_L) * Ref(n) - (Ratio_L) * Targ(n+N1) 수식 14(b)
여기서, Mid(n) 은 미드 신호 (811) 에 대응하며, Side(n) 은 사이드 신호 (813) 에 대응하며, Ref(n) 은 참조 신호 (103) 의 샘플들에 대응하며, N1 은 도 7 의 비-인과적 시간 부정합 값 (717) 에 대응하며, Targ(n+N1) 은 조정된 목표 신호 (105) 의 샘플들에 대응하며, Ratio_L 은 다운믹스 파라미터 (803) 에 대응한다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 기준 (823) 이 만족되는지를 결정하는 것에 기초하여 다운믹스 발생 결정 (895) 을 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는, CP 파라미터 (809) 가 제 2 값 (예컨대, 1) 을 갖는다고 그리고 기준 (823) 이 만족된다고 결정하는 것에 응답하여, 제 1 기법이 다운믹스 파라미터 (803) 를 발생시키는데 사용되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖는 다운믹스 발생 결정 (895) 을 발생시킨다. 대안적으로, 다운믹스 발생 결정기 (804) 는, CP 파라미터 (809) 가 제 1 값 (예컨대, 0) 을 갖는다고 또는 기준 (823) 이 만족되지 않는다고 결정하는 것에 응답하여, 제 2 기법이 다운믹스 파라미터 (803) 를 발생시키는데 사용되어야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖는 다운믹스 발생 결정 (895) 을 발생시킨다. 특정의 양태에서, 기준 (823) 을 만족시키는 것은 참조 신호 (103) 및 조정된 목표 신호 (105) 에 대응하는 사이드 신호 (예컨대, 사이드 신호 (813)) 가 예측을 위한 후보라는 것을 표시한다.
다운믹스 발생 결정기 (804) 는 제 1 사이드 신호 (851), 제 2 사이드 신호 (853), ICA 파라미터들 (107), 비교 값 (855), 시간 부정합 값 (857), 하나 이상의 다른 파라미터들 (810), 또는 이들의 조합에 기초하여, 기준 (823) 이 만족되는지를 결정하도록 구성된다. 특정의 양태에서, 다운믹스 발생 결정기 (804) 는 제 1 기법 및 제 2 기법에 대응하는 다운믹스 파라미터 값들의 각각에 대응하는 사이드 신호들의 비교에 기초하여, 기준 (823) 이 만족되는지를 결정한다. 예를 들어, 파라미터 발생기 (806) 는 제 1 기법을 이용하여 다운믹스 파라미터 값 (805) 을 발생시키고 제 2 기법을 이용하여 다운믹스 파라미터 값 (807) 을 발생시킨다. 미드사이드 발생기 (148) 는 수식들 9(b)-14(b) 중 하나에 기초하여 다운믹스 파라미터 값 (805) 에 대응하는 제 1 사이드 신호 (851) 를 발생시킨다. 예를 들어, Side(n) 은 제 1 사이드 신호 (851) 에 대응하며, Ratio_L 은 다운믹스 파라미터 값 (805) 에 대응한다. 미드사이드 발생기 (148) 는 수식들 9(b)-14(b) 중 하나에 기초하여 다운믹스 파라미터 값 (807) 에 대응하는 제 2 사이드 신호 (853) 를 발생시킨다. 예를 들어, Side(n) 은 제 2 사이드 신호 (853) 에 대응하며, Ratio_L 은 다운믹스 파라미터 값 (807) 에 대응한다.
다운믹스 발생 결정기 (804) 는 제 1 사이드 신호 (851) 의 제 1 에너지를 결정하며, 제 2 사이드 신호 (853) 의 제 2 에너지를 결정한다. 다운믹스 발생 결정기 (804) 는 제 1 에너지와 제 2 에너지의 비교에 기초하여 에너지 비교 값을 발생시킬 수도 있다. 다운믹스 발생 결정기 (804) 는 에너지 비교 값이 에너지 임계치를 만족시킨다고 결정하는 것에 기초하여, 기준 (823) 이 만족된다고 결정할 수도 있다. 예를 들어, 다운믹스 발생 결정기 (804) 는 제 1 에너지가 제 2 에너지보다 낮고 에너지 비교 값이 에너지 임계치를 만족시킨다고 결정하는 것에 적어도 부분적으로 기초하여, 기준 (823) 이 만족된다고 결정할 수도 있다. 다운믹스 발생 결정기 (804) 는 따라서, 다운믹스 파라미터 값 (805) 에 대응하는 제 1 사이드 신호 (851) 의 제 1 에너지가 다운믹스 파라미터 값 (807) 에 대응하는 제 2 사이드 신호 (853) 의 제 2 에너지보다 충분히 낮다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정할 수도 있다.
미드사이드 발생기 (148) 는 CP 파라미터 (809) 가 제 2 값 (예컨대, 1) 을 갖는다고 그리고 기준 (823) 이 만족된다고 결정하는 것에 응답하여, 제 1 사이드 신호 (851) 를 사이드 신호 (813) 로서 지정할 수도 있다. 대안적으로, 미드사이드 발생기 (148) 는 CP 파라미터 (809) 가 제 1 값 (예컨대, 0) 을 갖는다고 또는 기준 (823) 이 만족되지 않는다고 결정하는 것에 응답하여, 제 2 사이드 신호 (853) 를 사이드 신호 (813) 로서 지정할 수도 있다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 ICA 파라미터들 (107) 에 기초하여, 기준 (823) 이 만족되는지를 결정한다. 특정의 예에서, 다운믹스 발생 결정기 (804) 는 시간 부정합 값 (857) 이 상대적으로 작은 (예컨대, 없는) 시간 부정합을 표시한다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다. 예시하기 위하여, 다운믹스 발생 결정기 (804) 는 시간 부정합 값 (857) 과 특정의 값 (예컨대, 0) 사이의 차이가 시간 부정합 값 임계치를 만족시킨다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다. 시간 부정합 값 (857) 은 ICA 파라미터들 (107) 의, 임시 시간 부정합 값 (701), 내삽된 시간 부정합 값 (703), 정정된 시간 부정합 값 (705), 최종 시간 부정합 값 (707), 또는 비-인과적 시간 부정합 값 (717) 을 포함할 수도 있다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 비교 값 (855) 에 기초하여 기준 (823) 이 만족되는지를 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는 참조 신호 (103) (예컨대, Ref(n)) 의 샘플들과 조정된 목표 신호 (105) (예컨대, Targ(n+N1)) 의 대응하는 샘플들의 비교에 기초하여, 비교 값 (855) (예컨대, 차이 값, 유사도 값, 코히어런스 값, 또는 교차-상관 값) 을 결정한다. 예시하기 위하여, 다운믹스 발생 결정기 (804) 는 비교 값 (855) (예컨대, 차이 값, 유사도 값, 코히어런스 값, 또는 교차-상관 값) 이 임계치 (예컨대, 차이 임계치, 유사성 임계치, 코히어런스 임계치, 또는 교차-상관 임계치) 를 만족시킨다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다. 특정의 양태에서, 다운믹스 발생 결정기 (804) 는 더 높은 비상관이 가능하다는 것을 비교 값 (855) 이 표시할 때 기준 (823) 이 만족된다고 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는 비교 값 (855) 이 임계치보다 높은 교차-상관에 대응한다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다.
미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자에 기초하여 하나 이상의 다른 파라미터들 (810) 을 발생시키도록 구성될 수도 있다. 다른 파라미터들 (810) 은 음성 결정 파라미터 (815), 코어 유형 (817), 코더 유형 (819), 과도 표시자 (821), 보이싱 인자 (825), 또는 이들의 조합을 포함할 수도 있다. 예를 들어, 미드사이드 발생기 (148) 는 다양한 음성/음악 분류 기법들을 이용하여 음성 결정 파라미터 (815) 를 결정할 수도 있다. 음성 결정 파라미터 (815) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 음성 또는 비-음성 (예컨대, 음악 또는 잡음) 으로서 분류되는지 여부를 표시할 수도 있다.
미드사이드 발생기 (148) 는 코어 유형 (817), 코더 유형 (819), 또는 양자를 결정하도록 구성될 수도 있다. 예를 들어, 이전에 인코딩된 프레임은 이전 코어 유형, 이전 코더 유형, 또는 양자에 기초하여 인코딩되었을 수도 있다. 코어 유형 (817) 은 이전 코어 유형에 대응할 수도 있으며, 코더 유형 (819) 은 이전 코더 유형, 또는 양자에 대응할 수도 있다. 대안적인 양태에서, 미드사이드 발생기 (148) 는 음성 결정 파라미터 (815) 에 기초하여 코어 유형 (817), 코더 유형 (819), 또는 양자를 결정한다. 예를 들어, 미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 음성에 대응한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 음성 결정 파라미터 (815) 가 갖는다고 결정하는 것에 응답하여, ACELP 코어 유형을 코어 유형 (817) 으로서 선택할 수도 있다. 대안적으로, 미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 비-음성 (예컨대, 음악) 에 대응한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 음성 결정 파라미터 (815) 가 갖는다고 결정하는 것에 응답하여, 변환 코딩 여기 (TCX) 코어 유형을 코어 유형 (817) 으로서 선택할 수도 있다.
미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 음성에 대응한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 음성 결정 파라미터 (815) 가 갖는다고 결정하는 것에 응답하여, 일반적인 신호 코딩 (GSC) 코더 유형 또는 비-GSC 코더 유형을 코더 유형 (819) 으로서 선택할 수도 있다. 예를 들어, 미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 (예컨대, 희소성 임계치보다 더 높은) 높은 스펙트럼 희소성에 대응한다고 결정하는 것에 응답하여, 비-GSC 코더 유형 (예컨대, 변형 이산 코사인 변환 (MDCT)) 을 선택할 수도 있다. 대안적으로, 미드사이드 발생기 (148) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 (예컨대, 희소성 임계치보다 낮은) 비-희소 스펙트럼에 대응한다고 결정하는 것에 응답하여, GSC 코더 유형을 선택할 수도 있다.
미드사이드 발생기 (148) 는 참조 신호 (103) 의 에너지, 조정된 목표 신호 (105) 의 에너지, 또는 양자에 기초하여 과도 표시자 (821) 를 결정하도록 구성될 수도 있다. 예를 들어, 미드사이드 발생기 (148) 는 참조 신호 (103) 의 에너지, 조정된 목표 신호 (105) 의 에너지, 또는 양자가 임계치 급증보다 더 높은 것을 표시하지 않는다고 결정하는 것에 응답하여, 과도 표시자 (821) 를 과도가 검출되지 않는다는 것을 표시하는 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 급증은 임계치보다 적은 샘플들의 개수에 대응할 수도 있다. 대안적으로, 미드사이드 발생기 (148) 는 참조 신호 (103) 의 에너지, 조정된 목표 신호 (105) 의 에너지, 또는 양자가 임계치보다 높은 급증을 표시한다고 결정하는 것에 응답하여, 과도 표시자 (821) 를 과도가 검출된다는 것을 표시하는 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. 에너지에서의 급증 (예컨대, 증가) 는 임계치 미만의 샘플들의 개수와 연관될 수도 있다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 음성 결정 파라미터 (815) 에 기초하여 기준 (823) 이 만족되는지를 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는 참조 신호 (103), 조정된 목표 신호 (105), 또는 양자가 음성에 대응한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 음성 결정 파라미터 (815) 가 갖는다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 코더 유형 (819) 에 기초하여 기준 (823) 이 만족되는지를 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는 코더 유형 (819) 이 유성음 코더 유형 (예컨대, GSC 코더 유형) 에 대응한다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다.
특정의 양태에서, 다운믹스 발생 결정기 (804) 는 코어 유형 (817) 에 기초하여 기준 (823) 이 만족되는지를 결정한다. 예를 들어, 다운믹스 발생 결정기 (804) 는 코어 유형 (817) 이 음성 코딩 코어 (예컨대, ACELP 코어 유형) 에 대응한다고 결정하는 것에 응답하여, 기준 (823) 이 만족된다고 결정한다.
특정의 양태에서, 도 1 의 송신기 (110) 는 다운믹스 파라미터 (115) 가 디폴트 다운믹스 파라미터 값 (예컨대, 0.5) 과 상이하다고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) (예컨대, 다운믹스 파라미터 (803)) 를 송신할 수도 있다. 본 양태에서, 송신기 (110) 는 다운믹스 파라미터 (115) 가 디폴트 다운믹스 파라미터 값 (예컨대, 0.5) 에 매칭한다고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) 를 송신하는 것을 억제할 수도 있다.
특정의 양태에서, 송신기 (110) 는 다운믹스 파라미터 (115) 가 디코더 (118) 에서 이용불가능한 하나 이상의 파라미터들에 기초한다고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) 를 송신할 수도 있다. 특정의 예에서, 제 1 사이드 신호 (851) 의 에너지, 제 2 사이드 신호 (853) 의 에너지, 비교 값 (855), 또는 음성 결정 파라미터 (815) 중 적어도 하나는 디코더 (118) 에서 이용불가능하다. 이 예에서, 미드사이드 발생기 (148) 는 다운믹스 파라미터 (115) 가 제 1 사이드 신호 (851) 의 에너지, 제 2 사이드 신호 (853) 의 에너지, 비교 값 (855), 또는 음성 결정 파라미터 (815) 중 적어도 하나에 기초한다고 결정하는 것에 응답하여, 송신기 (110) 를 통한, 다운믹스 파라미터 (115) 의 송신을 개시할 수도 있다.
다운믹스 파라미터 (803) 가 특정의 값 (예컨대, 0) 으로부터 더 멀수록, 사이드 신호 (813) 가 미드 신호 (811) 에 공통인 더 많은 정보를 포함한다. 예를 들어, 추가적인 다운믹스 파라미터 (803) 는 특정의 값 (예컨대, 0), 사이드 신호 (813) 의 더 높은 에너지 및 사이드 신호 (813) 와 미드 신호 (811) 사이의 더 높은 상관으로부터 유래한다. 사이드 신호 (813) 가 더 낮은 에너지를 가지고 사이드 신호 (813) 와 미드 신호 (811) 사이의 비상관이 더 높을 때, 예측된 사이드 신호는 사이드 신호 (813) 에 더 가깝게 근접할 수도 있다.
사이드 신호 (813) 는 다운믹스 파라미터 값 (807) 을 가지는 다운믹스 파라미터 (803) 에 기초하여 발생될 때와 비교하여, 다운믹스 파라미터 값 (805) 을 가지는 다운믹스 파라미터 (803) 에 기초하여 발생될 때, 더 낮은 에너지를 가질 수도 있다. 다운믹스 파라미터 발생기 (802) 는 디코더 (118) 가 도 1 의 합성된 미드 신호 (171) 에 기초하여 합성된 사이드 신호 (173) 를 예측해야 한다는 것을 표시하는 제 2 값 (예컨대, 1) 을 CP 파라미터 (809) 가 가질 때 다운믹스 파라미터 값 (805) 에 기초하여 사이드 신호 (813) 가 발생될 수 있게 한다. 일부 구현예들에서, 다운믹스 파라미터 발생기 (802) 는 사이드 신호 (813) 의 더 높은 비상관이 가능하다는 것을 표시하는, CP 파라미터 (809) 가 제 2 값 (예컨대, 1) 을 가지고 기준 (823) 이 만족될 때 다운믹스 파라미터 값 (805) 에 기초하여 사이드 신호 (813) 가 발생될 수 있게 한다. 다운믹스 파라미터 값 (805) 에 기초하여 사이드 신호 (813) 를 발생시키는 것은 디코더에서의 예측된 사이드 신호가 사이드 신호 (813) 에 더 가깝게 근접할 우도를 증가시킨다.
도 9 를 참조하면, CP 선택기 (122) 의 일 예가 도시된다. CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 GICP (601) 중 적어도 하나에 기초하여 CP 파라미터 (919) 를 발생시키도록 구성된다. 특정의 양태에서, CP 파라미터 (919) 는 도 1 의 CP 파라미터 (109), 도 5 의 CP 파라미터 (509), 또는 양자에 대응한다.
동작 동안, CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 GICP (610) 중 적어도 하나를 수신할 수도 있다. CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (517), 또는 GICP (610) 중 적어도 하나에 기초하여 하나 이상의 표시자들 (960) 을 결정할 수도 있다. CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (517), GICP (610), 또는 표시자들 (960) 중 적어도 하나가 하나 이상의 임계치들 (901) 을 만족시키는지 여부를 결정하는 것에 기초하여, CP 파라미터 (919) 를 결정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 다음 의사 코드에 기초하여 CP 파라미터 (919) 를 결정한다:
st_stereo->icpFlag = 1;
if (isICAStable == 0)
{
/* ICA 시프트 또는 이득이 안정하지 않음 */
if (isShiftStable)
{
/* 시프트가 안정하며, 이는 이득이 불안정하다는 것을 의미함 */
if (isGICPHigh)
{
/* gICP 가 높으며, 이는 사이드가 높고
그리고 예측이 위험함을 의미함 */
st_stereo->icpFlag = 0;
}
}
else
{
/* ICA 시프트가 안정하지 않으며, 이는 예측하는데 위험함을 의미함 */
st_stereo->icpFlag = 0;
}
}
여기서, st_stereo->icpFlag 는 CP 파라미터 (919) 에 대응하며, isICAStable 는 ICA 안정성 표시자 (975) 에 대응하며, isShiftStable 는 시간 부정합 안정성 표시자 (965) 에 대응하며, isGICPHigh 는 GICP 높은 표시자 (977) 에 대응한다.
CP 선택기 (122) 는 GICP (601) 에 기초하여 GICP 높은 표시자 (977) 를 발생시킬 수도 있다. 예를 들어, GICP 높은 표시자 (977) 는 GICP (601) 가 GICP 높은 임계치 (923) (예컨대, 0.7) 를 만족시시키는 (예컨대, 이보다 큰) 지 여부를 표시한다. 예를 들어, CP 선택기 (122) 는 GICP (601) 가 GICP 높은 임계치 (923) (예컨대, 0.7) 를 만족시키지 못한다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, GICP 높은 표시자 (977) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 GICP (601) 가 GICP 높은 임계치 (923) (예컨대, 0.7) 를 만족시킨다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, GICP 높은 표시자 (977) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
CP 선택기 (122) 는 프레임들에 걸친 시간 부정합 값들 (TMVs) 의 전개 (evolution) 에 기초하여 시간 부정합 안정성 표시자 (965) 를 발생시킬 수도 있다. 예를 들어, CP 선택기 (122) 는 TMV (943) 및 제 2 TMV (945) 에 기초하여 시간 부정합 안정성 표시자 (965) 를 발생시킬 수도 있다. ICA 파라미터들 (107) 은 TMV (943) 및 제 2 TMV (945) 를 포함할 수도 있다. TMV (943) 는 도 7 의, 임시 TMV (701), 내삽된 TMV (703), 정정된 TMV (705), 또는 최종 TMV (707) 를 포함할 수도 있다. 제 2 TMV (945) 는 이전에 인코딩된 프레임에 대응하는, 임시 TMV, 내삽된 TMV, 정정된 TMV, 또는 최종 TMV 를 포함할 수도 있다. 예를 들어, TMV (943) 는 참조 신호 (103) 의 제 1 샘플들에 기초할 수도 있으며, 제 2 TMV (945) 는 참조 신호 (103) 의 제 2 샘플들에 기초할 수도 있다. 제 1 샘플들은 제 2 샘플들과 구별될 수도 있다. 예를 들어, 제 1 샘플들은 제 2 샘플들에 포함되지 않는 적어도 하나의 샘플을 포함할 수도 있으며, 제 2 샘플들은 제 1 샘플들에 포함되지 않는 적어도 하나의 샘플, 또는 양자를 포함할 수도 있다. 다른 예로서, TMV (943) 는 목표 신호의 제 1 특정의 샘플들에 기초할 수도 있으며, 제 2 TMV (945) 는 목표 신호의 제 2 특정의 샘플들에 기초할 수도 있다. 제 1 특정의 샘플들은 제 2 특정의 샘플들과 구별될 수도 있다. 예를 들어, 제 1 특정의 샘플들은 제 2 특정의 샘플들에 포함되지 않는 적어도 하나의 샘플을 포함할 수도 있으며, 제 2 특정의 샘플들은 제 1 특정의 샘플들에 포함되지 않는 적어도 하나의 샘플, 또는 양자를 포함할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 TMV (943) 와 제 2 TMV (945) 사이의 차이가 시간 부정합 안정성 임계치 (905) 보다 크다고, TMV (943) 또는 제 2 TMV (945) 중 하나가 양이고 TMV (943) 또는 제 2 TMV (945) 중 다른 하나가 음이라고, 또는 양자를 결정하는 것에 응답하여, 시간 부정합 안정성 표시자 (965) 를 제 1 값 (예컨대, 0) 으로 설정한다. 시간 부정합 안정성 표시자 (965) 의 제 1 값 (예컨대, 0) 은 시간 부정합이 불안정하다는 것을 표시할 수도 있다. CP 선택기 (122) 는 TMV (943) 와 제 2 TMV (945) 사이의 차이가 시간 부정합 안정성 임계치 (905) 이하라고, TMV (943) 및 제 2 TMV (945) 가 양이라고, TMV (943) 및 제 2 TMV (945) 가 음이라고, TMV (943) 또는 제 2 TMV (945) 중 하나가 제로라고, 또는 이들의 조합을 결정하는 것에 응답하여, 시간 부정합 안정성 표시자 (965) 를 제 2 값 (예컨대, 1) 으로 설정한다. 시간 부정합 안정성 표시자 (965) 의 제 2 값 (예컨대, 1) 은 시간 부정합이 안정하다는 것을 표시할 수도 있다.
CP 선택기 (122) 는 시간 부정합 안정성 표시자 (965), ICA 이득 안정성 표시자 (973) (예컨대, 채널간 이득 안정성 표시자), 또는 ICA 이득 신뢰성 표시자 (971) (예컨대, 채널간 이득 신뢰성 표시자) 중 적어도 하나에 기초하여, ICA 안정성 표시자 (975) 를 발생시킬 수도 있다. 예를 들어, CP 선택기 (122) 는 시간 부정합이 불안정하다는 것을 표시하는 제 1 값 (예컨대, 0) 을 시간 부정합 안정성 표시자 (965) 가 갖는다고, ICA 이득이 불안정하다는 것을 표시하는 제 1 값 (예컨대, 0) 을 ICA 이득 안정성 표시자 (973) 가 갖는다고, 또는 ICA 이득이 신뢰할 수 없다는 것을 표시하는 제 1 값 (예컨대, 0) 을 ICA 이득 신뢰성 표시자 (971) 가 갖는다고 결정하는 것에 응답하여, ICA 안정성 표시자 (975) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 시간 부정합이 안정하다는 것을 표시하는 제 2 값 (예컨대, 1) 을 시간 부정합 안정성 표시자 (965) 가 갖는다고, ICA 이득이 안정하다는 것을 표시하는 제 2 값 (예컨대, 1) 을 ICA 이득 안정성 표시자 (973) 가 갖는다고, 그리고 ICA 이득이 신뢰성있다는 것을 표시하는 제 2 값 (예컨대, 1) 을 ICA 이득 신뢰성 표시자 (971) 가 갖는다고 결정하는 것에 응답하여, ICA 안정성 표시자 (975) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. ICA 안정성 표시자 (975) 의 제 1 값 (예컨대, 0) 은 ICA 가 불안정하다는 것을 표시할 수도 있다. ICA 안정성 표시자 (975) 의 제 2 값 (예컨대, 1) 은 ICA 가 안정하다는 것을 표시할 수도 있다.
CP 선택기 (122) 는 프레임들에 걸친 ICA 이득들의 전개에 기초하여 ICA 이득 안정성 표시자 (973) 를 발생시킬 수도 있다. CP 선택기 (122) 는 제 1 ICA 이득 파라미터 (715), ICA 이득 파라미터 (709), 평활화된 ICA 이득 파라미터 (713), 또는 이들의 조합에 기초하여 ICA 이득 안정성 표시자 (973) 를 결정할 수도 있다. ICA 파라미터들 (107) 은 ICA 이득 파라미터 (709), 제 1 ICA 이득 파라미터 (715), 및 평활화된 ICA 이득 파라미터 (713) 를 포함할 수도 있다. CP 선택기 (122) 는 ICA 이득 파라미터 (709) 와 제 1 ICA 이득 파라미터 (715) 사이의 차이에 기초하여 이득 차이를 결정할 수도 있다. 대안적인 양태에서, CP 선택기 (122) 는 평활화된 ICA 이득 파라미터 (713) 와 제 1 ICA 이득 파라미터 (715) 사이의 차이에 기초하여 이득 차이를 결정할 수도 있다.
CP 선택기 (122) 는 이득 차이가 ICA 이득 안정성 임계치 (913) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, ICA 이득 안정성 표시자 (973) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 이득 차이가 ICA 이득 안정성 임계치 (913) 를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, ICA 이득 안정성 표시자 (973) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. ICA 이득 안정성 표시자 (973) 의 제 1 값 (예컨대, 0) 은 ICA 이득이 불안정하다는 것을 표시할 수도 있다. ICA 이득 안정성 표시자 (973) 의 제 2 값 (예컨대, 1) 은 ICA 이득이 안정하다는 것을 표시할 수도 있다.
CP 선택기 (122) 는 ICA 이득 파라미터 (709) 및 평활화된 ICA 이득 파라미터 (713) 에 기초하여 ICA 이득 신뢰성 표시자 (971) 를 결정할 수도 있다. ICA 파라미터들 (107) 은 ICA 이득 파라미터 (709) 및 평활화된 ICA 이득 파라미터 (713) 를 포함할 수도 있다. CP 선택기 (122) 는 ICA 이득 파라미터 (709) 와 평활화된 ICA 이득 파라미터 (713) 사이의 차이가 ICA 이득 신뢰성 임계치 (911) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, ICA 이득 신뢰성 표시자 (971) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 ICA 이득 파라미터 (709) 와 평활화된 ICA 이득 파라미터 (713) 사이의 차이가 ICA 이득 신뢰성 임계치 (911) 를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, ICA 이득 신뢰성 표시자 (971) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. ICA 이득 신뢰성 표시자 (971) 의 제 1 값 (예컨대, 0) 은 ICA 이득이 신뢰할 수 없다는 것을 표시할 수도 있다. 예를 들어, ICA 이득 신뢰성 표시자 (971) 의 제 1 값 (예컨대, 0) 은 스테레오 지각이 변하도록 ICA 이득이 너무 느리게 평활화된다는 것을 표시할 수도 있다. ICA 이득 신뢰성 표시자 (971) 의 제 2 값 (예컨대, 1) 은 ICA 이득이 신뢰성있다는 것을 표시할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 다음 의사 코드에 기초하여 CP 파라미터 (919) 를 결정한다:
if (isGICPLow || st_stereo->sp_aud_decision0 == 1 || (st[0]->last_core > ACELP_CORE))
{
/* 사이드가 코딩하는데 중요하지 않다는 것을 의미하는, gICP 가 낮을 때, 또는 음성/오디오 결정 또는 미드 코딩 모드가 코딩보다는 예측이 필요한 음악 콘텐츠를 가지는 미드 신호를 가리킬 때, ICP 를 인에이블링한다 */
st_stereo->icpFlag = 1;
}
else if (isGICPHigh || (gICP > 0.6f && (!isICAStable || !isICAGainReliable)) || st_stereo->attackPresent)
{
/* 사이드가 높은 에너지를 갖는다는 것을 의미하는, gICP 가 높을 때, 또는 순시 icp_gain 이 높고, ICA 가 불안정하거나 또는 ICA 이득이 신뢰성이 없을 때 또는 예측이 필요하지 않는 입력 음성에 과도가 존재할 때, ICP 및 코드를 디스에이블링한다 */
st_stereo->icpFlag = 0;
}
여기서, st_stereo->icpFlag 는 CP 파라미터 (919) 에 대응하며, isGICPLow 는 GICP 낮은 표시자 (979) 에 대응하며, st_stereo->sp_aud_decision0 는 음성 결정 파라미터 (815) 에 대응하며, st[0]->last_core 는 코어 유형 (817) 에 대응하며, isGICPHigh 는 GICP 높은 표시자 (977) 에 대응하며, gICP 는 GICP (601) 에 대응하며, isICAStable 은 ICA 안정성 표시자 (975) 에 대응하며, isICAGainReliable 은 ICA 이득 신뢰성 표시자 (971) 에 대응하며, st_stereo->attackPresent 는 과도 표시자 (821) 에 대응한다.
CP 선택기 (122) 는 GICP (601) 에 기초하여 GICP 낮은 표시자 (979) 를 발생시킬 수도 있다. 예를 들어, GICP 낮은 표시자 (979) 는 GICP (601) 가 GICP 낮은 임계치 (921) (예컨대, 0.5) 를 만족시키는지 (예컨대, 이하인지) 여부를 표시한다. 예를 들어, CP 선택기 (122) 는 GICP (601) 가 GICP 낮은 임계치 (921) (예컨대, 0.5) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, GICP 낮은 표시자 (979) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 GICP (601) 가 GICP 낮은 임계치 (921) (예컨대, 0.5) 를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, GICP 낮은 표시자 (979) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. GICP 낮은 임계치 (921) 는 GICP 높은 임계치 (923) 와 동일하거나 또는 상이할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (810), 또는 GICP (601) 중 하나 이상이 대응하는 임계치를 만족시키는지 여부를 결정하는 것에 기초하여, CP 파라미터 (919) 를 결정할 수도 있다. 예를 들어, CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (810), 또는 GICP (601) 중 하나 이상이 대응하는 임계치를 만족시키지 못한다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (810), 또는 GICP (601) 중 하나 이상이 대응하는 임계치를 만족시킨다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 GICP (610) 가 GICP 임계치 (915) (예컨대, 채널간 예측 이득 임계치) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 GICP (610) 가 GICP 임계치 (915) 를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 ICA 이득 파라미터 (709) 가 ICA 이득 임계치 (예컨대, 채널간 이득 임계치) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 기초하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 ICA 이득 파라미터 (709) 가 ICA 이득 임계치를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 기초하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 평활화된 ICA 이득 파라미터 (713) 가 평활화된 채널간 이득 임계치를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 기초하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 평활화된 ICA 이득 파라미터 (713) 가 평활화된 채널간 이득 임계치를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 기초하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 다운믹스 파라미터 (515) 와 특정의 값 (예컨대, 0.5) 사이의 다운믹스 차이가 다운믹스 임계치 (917) 를 만족시키지 못한다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 다운믹스 차이가 다운믹스 임계치 (917) 를 만족시킨다 (예컨대, 이하이다) 고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 코더 유형 (819) 이 특정의 코더 유형 (예컨대, 음성 코더) 에 대응한다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 코더 유형 (819) 이 특정의 코더 유형 (예컨대, 비-음성 코더) 에 대응하지 않는다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 보이싱 인자 (825) 가 임계치 (예컨대, 강한 유성음 또는 약한 유성음 또는 약한 무성음) 를 만족시킨다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, CP 선택기 (122) 는 보이싱 인자 (825) 가 임계치 (예컨대, 강한 무성음) 를 만족시키지 못한다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 제 2 값 (예컨대, 1) 으로 설정할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 CP 파라미터 (919) 를, 사이드 신호가 송신을 위해 인코딩되어야 한다는 것, 인코딩된 사이드 신호가 송신되어야 한다는 것, 및 디코더가 디코딩 인코딩된 사이드 신호에 기초하여 합성된 사이드 신호를 발생시켜야 한다는 것을 표시하는 디폴트 값 (예컨대, 1) 으로 설정할 수도 있다. 예를 들어, CP 선택기 (122) 는 CP 파라미터 (919) 가 ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (517), 및 GICP (610) 와 독립적으로 발생되어야 한다고 결정하는 것에 응답하여, CP 파라미터 (919) 를 디폴트 값 (예컨대, 1) 으로 설정할 수도 있다. 본 양태에서, CP 파라미터 (919) 는 도 5 의 CP 파라미터 (509) 에 대응할 수도 있다.
특정의 양태에서, CP 선택기 (122) 는 임계치들 (901) 중 하나 이상을 수정하기 위해 히스테리시스를 적용할 수도 있다. 예를 들어, CP 선택기 (122) 는 이전에 인코딩된 프레임과 연관된 GICP 가 제 2 GICP 임계치 (예컨대, 0.9) 를 만족시킨다 (예컨대, 보다 크다) 고 결정하는 것에 응답하여, GICP 높은 임계치 (923) 를 제 1 값 (예컨대, 0.7) 으로부터 제 2 값 (예컨대, 0.6) 으로 수정할 수도 있다. CP 선택기 (122) 는 GICP 높은 임계치 (923) 의 제 2 값에 기초하여 GICP 높은 표시자 (977) 를 결정할 수도 있다. GICP 높은 임계치 (923) 가 예시적인 예로서 사용되며, 다른 구현예들에서, CP 선택기 (122) 는 하나 이상의 추가적인 임계치들을 수정하기 위해 히스테리시스를 적용할 수도 있는 것으로 이해되어야 한다. 히스테리시스를 임계치들 (901) 중 하나 이상에 적용하는 것은 프레임들에 걸쳐 CP 파라미터 (919) 에서의 변동성을 감소시킬 수도 있다.
ICA 파라미터들 (107), 다운믹스 파라미터 (515), 다른 파라미터들 (810), GICP (601), 임계치들 (901), 및 표시자들 (960) 이 예시적인 예들로서 본원에서 설명되며, 다른 구현예들에서, CP 선택기 (122) 는 CP 파라미터 (919) 를 결정하기 위해 다른 파라미터들, 표시자들, 임계치들, 또는 이들의 조합을 이용할 수도 있는 것으로 이해되어야 한다. 예를 들어, CP 선택기 (122) 는 피치, 기울기, 미드-대-사이드 교차 상관, 사이드의 절대 에너지, 또는 이들의 조합에 기초하여 CP 파라미터 (919) 를 결정할 수도 있다. ICA 이득 또는 시간 부정합의 전개에 기초하여 CP 파라미터 (919) 를 결정하는 것이 예시적인 예들로서 설명되며, 다른 구현예들에서, CP 선택기 (122) 는 프레임들에 걸친 하나 이상의 추가적인 파라미터들의 전개에 기초하여 CP 파라미터 (919) 를 결정할 수도 있는 것으로 이해되어야 한다.
도 10 을 참조하면, CP 결정기 (172) 의 일 예가 도시된다. CP 결정기 (172) 는 CP 파라미터 (179) 를 발생시키도록 구성된다. CP 파라미터 (179) 는 CP 파라미터 (109) 에 대응할 수도 있다.
동작 동안, CP 결정기 (172) 는, 코딩 파라미터들 (140) 이 CP 파라미터 (109) 를 포함한다고 결정하는 것에 응답하여, CP 파라미터 (179) 를 CP 파라미터 (109) 와 동일한 값으로 설정한다. 대안적으로, CP 결정기 (172) 는, 코딩 파라미터들 (140) 이 CP 파라미터 (109) 를 포함하지 않는다고 결정하는 것에 응답하여, 도 9 를 참조하여 CP 선택기 (122) 에 의해 수행되는 것으로 설명된 하나 이상의 기법들을 수행함으로써 CP 파라미터 (179) 를 결정한다. 예를 들어, CP 결정기 (172) 는 다운믹스 파라미터 (115), ICA 파라미터들 (107), 다른 파라미터들 (810), 임계치들 (901), 또는 표시자들 (960) 중 적어도 하나에 기초하여, CP 파라미터 (179) 를 결정할 수도 있다. CP 파라미터 (179) 의 제 1 값 (예컨대, 0) 은 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응한다는 것을 표시할 수도 있다. CP 파라미터 (179) 의 제 2 값 (예컨대, 1) 은 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다는 것을 표시할 수도 있다. CP 결정기 (172) 는 따라서 디코더 (118) 가 합성된 사이드 신호 (173) 가 합성된 미드 신호 (171) 에 기초하여 예측되거나 또는 비트스트림 파라미터들 (102) 에 기초하여 디코딩되어야 하는지 여부를 동적으로 결정가능하게 한다.
도 11 을 참조하면, 업믹스 파라미터 발생기 (176) 의 일 예가 도시되며 일반적으로 1100 으로 지정된다. 예 (1100) 에서, 코딩 파라미터들 (140) 은 다운믹스 파라미터 (115) 를 포함한다.
동작 동안, 업믹스 파라미터 발생기 (176) 는, 코딩 파라미터들 (140) 이 다운믹스 파라미터 (115) 를 포함한다고 결정하는 것에 응답하여, 다운믹스 파라미터 (115) 에 대응하는 업믹스 파라미터 (175) 를 발생시킨다. 예를 들어, 업믹스 파라미터 (175) 는 다운믹스 파라미터 (115) 와 동일한 값을 가질 수도 있다. 다운믹스 파라미터 (115) 는 도 8 을 참조하여 설명된 바와 같이, 다운믹스 파라미터 값 (805) 또는 다운믹스 파라미터 값 (807) 을 가질 수도 있다. 특정의 양태에서, 다운믹스 파라미터 값 (805) 은 디폴트 파라미터 값 (예컨대, 0.5) 에 대응할 수도 있다. 특정의 양태에서, 업믹스 파라미터 발생기 (176) 는 코딩 파라미터들 (140) 이 다운믹스 파라미터 (115) 를 포함하지 않는다고 결정하는 것에 응답하여, 업믹스 파라미터 (175) 를 디폴트 값 (예컨대, 0.5) 으로 설정할 수도 있다.
도 11 은 또한 업믹스 파라미터 발생기 (176) 의 예 (1102) 를 포함한다. 예 (1102) 에서, 업믹스 파라미터 발생기 (176) 는 CP 파라미터 (179) 에 기초하여 업믹스 파라미터 (175) 를 결정한다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 CP 파라미터 (179) 가 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 업믹스 파라미터 (175) 를 다운믹스 파라미터 값 (807) 으로 설정할 수도 있다. 코딩 파라미터들 (140) 은 다운믹스 파라미터 값 (807) 을 포함할 수도 있다. 대안적으로, 업믹스 파라미터 발생기 (176) 는 CP 파라미터 (179) 가 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 업믹스 파라미터 (175) 를 다운믹스 파라미터 값 (805) 으로 설정할 수도 있다. 특정의 양태에서, 다운믹스 파라미터 값 (805) 은 디폴트 파라미터 값 (예컨대, 0.5) 에 대응할 수도 있다. 대안적인 양태에서, 업믹스 파라미터 발생기 (176) 는 도 8 의 파라미터 발생기 (806) 를 참조하여 설명된 바와 같이, 다운믹스 파라미터 값 (807) 에 기초하여 다운믹스 파라미터 값 (805) 을 결정할 수도 있다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 동적 범위 감소 함수 (예컨대, 수정된 S자형) 를 다운믹스 파라미터 값 (807) 에 적용함으로써, 다운믹스 파라미터 값 (805) 을 결정할 수도 있다. 다른 예로서, 업믹스 파라미터 발생기 (176) 는 도 8 의 파라미터 발생기 (806) 를 참조하여 설명된 바와 같이, 다운믹스 파라미터 값 (807), 보이싱 인자 (825), 또는 양자에 기초하여 다운믹스 파라미터 값 (805) 을 결정할 수도 있다. 코딩 파라미터들 (140) 은 다운믹스 파라미터 값 (807), 보이싱 인자 (825), 또는 양자를 결정할 수도 있다.
특정의 양태에서, 업믹스 파라미터 발생기 (176) 는, 코딩 파라미터들 (140) 이 다운믹스 파라미터 (115) 를 포함하지 않는다고 결정하는 것에 응답하여, CP 파라미터 (179) 에 기초하여 업믹스 파라미터 (175) 를 결정한다. 대안적인 양태에서, 업믹스 파라미터 발생기 (176) 는, CP 파라미터 (179) 가 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 코딩 파라미터들 (140) 이 다운믹스 파라미터 (115) 를 포함한다고 결정하고 다운믹스 파라미터 (115) 에 대응하는 업믹스 파라미터 (175) 를 결정한다. 업믹스 파라미터 (175) 는 다운믹스 파라미터 (115) 와 동일할 수도 있다. 다운믹스 파라미터 (115) 는 다운믹스 파라미터 값 (807) 을 표시할 수도 있다. 대안적으로, 업믹스 파라미터 발생기 (176) 는, CP 파라미터 (179) 가 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 코딩 파라미터들 (140) 이 다운믹스 파라미터 (115) 를 포함하지 않는다고 결정하고, 업믹스 파라미터 (175) 를 다운믹스 파라미터 값 (805) 으로 설정한다. 다운믹스 파라미터 값 (805) 은 도 8 을 참조하여 설명된 바와 같이, 디폴트 파라미터 값 (예컨대, 0.5), 다운믹스 파라미터 값 (807), 또는 양자에 기초할 수도 있다. 코딩 파라미터들 (140) 은 다운믹스 파라미터 값 (807) 을 포함할 수도 있다.
업믹스 파라미터 발생기 (176) 는 따라서 CP 파라미터 (179) 에 기초하여 업믹스 파라미터 (175) 를 결정하는 것을 가능하게 할 수도 있다. 특정의 양태에서, 송신기 (110) 는 CP 파라미터 (109) 의 제 2 값 (예컨대, 1) 을 표시하는 단일 비트를 송신하며, CP 결정기 (172) 는 단일 비트에 의해 표시되는 제 2 값 (예컨대, 1) 에 기초하여 CP 파라미터 (179) 를 결정하고, 업믹스 파라미터 발생기 (176) 는 CP 파라미터 (179) 에 기초하여 디폴트 값 (예컨대, 0) 에 대응하는 업믹스 파라미터 (175) 를 결정한다. 본 양태에서, 업믹스 파라미터 발생기 (176) 는 송신기 (110) 에 의해 송신된 단일 비트의 값에 기초하여 업믹스 파라미터 (175) 를 발생시킨다. 업믹스 파라미터 발생기 (176) 는 다운믹스 파라미터 (115) 를 송신하는 것을 억제함으로써 네트워크 리소스들 (예컨대, 대역폭) 을 절약한다. 업믹스 파라미터 발생기 (176) 는 다운믹스 파라미터 (115) 를 송신하는데 송신될 비트들을 용도 변경하여, 다른 파라미터 (예컨대, 도 6 의 GICP (603)), 비트스트림 파라미터들 (102), 또는 이들의 조합을 송신할 수도 있다.
도 12 를 참조하면, 업믹스 파라미터 발생기 (176) 의 일 예가 도시되며 일반적으로 1200 으로 지정된다. 예 (1200) 에서, 코딩 파라미터들 (140) 은 다운믹스 발생 결정 (895) 을 포함한다.
업믹스 파라미터 발생기 (176) 는, 다운믹스 발생 결정 (895) 이 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (805) 을 업믹스 파라미터 (175) 로서 지정한다. 대안적으로, 업믹스 파라미터 발생기 (176) 는, 다운믹스 발생 결정 (895) 이 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) 을 업믹스 파라미터 (175) 로서 지정한다. 특정의 양태에서, 다운믹스 파라미터 값 (805) 은 디폴트 값 (예컨대, 0.5) 에 대응할 수도 있다. 대안적인 양태에서, 업믹스 파라미터 발생기 (176) 는 도 8 의 파라미터 발생기 (806) 을 참조하여 설명된 바와 같이, 다운믹스 파라미터 값 (807) 에 기초하여 다운믹스 파라미터 값 (805) 을 결정할 수도 있다. 코딩 파라미터들 (140) 은 다운믹스 파라미터 값 (807) 을 포함할 수도 있다.
도 12 는 또한 업믹스 파라미터 발생기 (176) 의 예 (1202) 를 포함한다. 예 (1202) 에서, 업믹스 파라미터 발생기 (176) 는 파라미터 발생기 (1206) 에 커플링된 다운믹스 발생 결정기 (1204) 를 포함한다. 다운믹스 발생 결정기 (1204) 는 도 8 의 다운믹스 발생 결정기 (804) 에 대응한다. 파라미터 발생기 (1206) 는 도 8 의 파라미터 발생기 (806) 에 대응한다.
다운믹스 발생 결정기 (1204) 는 CP 파라미터 (179), 도 8 의 기준 (823), 또는 양자에 기초하여 다운믹스 발생 결정 (1295) 을 발생시킬 수도 있다. 예를 들어, 다운믹스 발생 결정기 (1204) 는 도 8 의 다운믹스 발생 결정기 (804) 에 의해 수행되는 하나 이상의 동작들을 수행하여 다운믹스 발생 결정 (895) 을 발생시킬 수도 있다. CP 파라미터 (179) 는 도 8 의 CP 파라미터 (809) 에 대응할 수도 있다. 파라미터 발생기 (1206) 는 다운믹스 발생 결정 (1295) 에 기초하여, 다운믹스 파라미터 값 (805) 또는 다운믹스 파라미터 (807) 를 업믹스 파라미터 (175) 로서 지정할 수도 있다.
파라미터 발생기 (1206) 는 다운믹스 파라미터 (803) 를 발생시키기 위해 도 8 의 파라미터 발생기 (806) 에 의해 수행되는 하나 이상의 동작들을 수행할 수도 있다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 다운믹스 발생 결정 (1295) 이 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (805) 을 업믹스 파라미터 (175) 로서 지정할 수도 있다. 대안적으로, 업믹스 파라미터 발생기 (176) 는 다운믹스 발생 결정 (1295) 이 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) 을 업믹스 파라미터 (175) 로서 지정할 수도 있다.
특정의 양태에서, 업믹스 파라미터 발생기 (176) 는 인코더 (114) 및 디코더 (118) 에서 이용가능한 정보에 기초하여 업믹스 파라미터 (175) 를 결정한다. 예를 들어, 다운믹스 발생 결정기 (1204) 는 도 8 의 다운믹스 발생 결정기 (804) 를 참조하여 설명된 바와 같이, 도 8 의, 코더 유형 (819), 코어 유형 (817), 또는 양자에 기초하여, 기준 (823) 이 만족되는지를 결정할 수도 있다. 다른 예로서, 파라미터 발생기 (1206) 는 도 8 의 파라미터 발생기 (806) 를 참조하여 설명된 바와 같이, 다운믹스 파라미터 값 (807), 보이싱 인자 (825), 또는 양자에 기초하여, 다운믹스 파라미터 값 (805) 을 발생시킬 수도 있다. 코딩 파라미터들 (140) 은 다운믹스 파라미터 값 (807), 보이싱 인자 (825), 코더 유형 (819), 코어 유형 (817), 또는 이들의 조합을 포함할 수도 있다.
특정의 양태에서, 도 1 의 송신기 (110) 는 기준 (823) 이 만족되는지를 표시하는 기준 만족된 표시자를 송신할 수도 있다. 다운믹스 발생 결정기 (1204) 는 CP 파라미터 (179) 및 기준 만족된 표시자에 기초하여 다운믹스 발생 결정 (1295) 을 결정할 수도 있다. 예를 들어, 다운믹스 발생 결정기 (1204) 는 CP 파라미터 (179) 가 제 1 값 (예컨대, 0) 을 갖는다고 또는 기준 만족된 표시자가 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 제 2 값 (예컨대, 1) 을 갖는 다운믹스 발생 결정 (1295) 을 발생시킬 수도 있다. 다른 예로서, 다운믹스 발생 결정기 (1204) 는 CP 파라미터 (179) 가 제 2 값 (예컨대, 1) 을 갖는다고 또는 기준 만족된 표시자가 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 제 1 값 (예컨대, 0) 을 갖는 다운믹스 발생 결정 (1295) 을 발생시킬 수도 있다. 기준 만족된 표시자의 제 1 값 (예컨대, 0) 은 기준 (823) 이 만족되지 않는다고 다운믹스 발생 결정기 (804) 가 결정하는 것을 표시할 수도 있다. 기준 만족된 표시자의 제 2 값 (예컨대, 1) 은 기준 (823) 이 만족된다고 다운믹스 발생 결정기 (804) 가 결정하는 것을 표시할 수도 있다.
특정의 양태에서, 업믹스 파라미터 발생기 (176) 는 구성 세팅에 기초하여 하나 이상의 파라미터들을 선택할 수도 있으며, 선택된 파라미터들에 기초하여 업믹스 파라미터 (175) 를 결정할 수도 있다. 예를 들어, 다운믹스 발생 결정기 (1204) 는 선택된 파라미터들의 제 1 세트에 기초하여 기준 (823) 이 만족되는지를 결정할 수도 있다. 다른 예로서, 파라미터 발생기 (1206) 는 선택된 파라미터들의 제 2 세트에 기초하여 다운믹스 파라미터 값 (805) 을 결정할 수도 있다. 업믹스 파라미터 발생기 (176) 는 따라서 도 1 의 다운믹스 파라미터 (115) 에 대응하는 업믹스 파라미터 (175) 를 결정하는 다양한 기법들을 가능하게 할 수도 있다.
도 13 을 참조하면, 채널간 예측 이득 파라미터에 기초하여 중간 사이드 신호를 합성하고 중간 사이드 신호를 필터링하여 (예컨대, 비상관 필터링하여) 사이드 신호를 합성하는 시스템 (1300) 의 특정의 예시적인 예가 도시된다. 특정의 구현예에서, 도 13 의 시스템 (1300) 은 또한 합성된 미드 신호에 기초하여 합성된 사이드 신호를 예측한다는 결정 이후 도 1 의 시스템 (100) 을 포함하거나 또는 이에 대응한다. 일부 구현예들에서, 시스템 (1300) 은 또한 도 2 의 시스템 (200) 을 포함하거나 또는 이에 대응한다. 시스템 (1300) 은 네트워크 (1305) 를 통해서 제 2 디바이스 (1306) 에 통신가능하게 커플링된 제 1 디바이스 (1304) 를 포함한다. 네트워크 (1305) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 제 1 디바이스 (1304), 네트워크 (1305), 및 제 2 디바이스 (1306) 는 도 1 의, 제 1 디바이스 (104), 네트워크 (120), 및 제 2 디바이스 (106), 또는 도 2 의, 제 1 디바이스 (204), 네트워크 (205), 및 제 2 디바이스 (206) 를 각각 포함하거나 또는 이에 대응할 수도 있다. 특정의 구현예에서, 제 1 디바이스 (1304) 는 또한 모바일 디바이스를 포함하거나 또는 이에 대응한다. 다른 특정의 구현예에서, 제 1 디바이스 (1304) 는 또한 기지국을 포함하거나 또는 이에 대응한다. 특정의 구현예에서, 제 2 디바이스 (1306) 는 또한 모바일 디바이스를 포함하거나 또는 이에 대응한다. 다른 특정의 구현예에서, 제 2 디바이스 (1306) 는 또한 기지국을 포함하거나 또는 이에 대응한다.
제 1 디바이스 (1304) 는 인코더 (1314), 송신기 (1310), 하나 이상의 입력 인터페이스들 (1312), 또는 이들의 조합을 포함할 수도 있다. 하나 이상의 입력 인터페이스들 (1312) 은 도 1 내지 도 2 를 참조하여 설명된 바와 같이, 제 1 오디오 신호 (1330) 및 제 2 오디오 신호 (1332) 를, 예컨대 하나 이상의 마이크로폰들로부터, 수신하도록 구성될 수도 있다.
인코더 (1314) 는 도 1 을 참조하여 설명된 바와 같이, 오디오 신호들을 다운믹싱 및 인코딩하도록 구성될 수도 있다. 특정의 구현예에서, 인코더 (1314) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (1330) 및 제 2 오디오 신호 (1332) 에 대해, 하나 이상의 정렬 동작들을 수행하도록 구성될 수도 있다. 인코더 (1314) 는 신호 발생기 (1316), 채널간 예측 이득 파라미터 (ICP) 발생기 (1320), 및 비트스트림 발생기 (1322) 를 포함한다. 신호 발생기 (1316) 는 ICP 발생기 (1320) 에, 그리고 비트스트림 발생기 (1322) 에 커플링될 수도 있으며, ICP 발생기 (1320) 는 비트스트림 발생기 (1322) 에 커플링될 수도 있다. 신호 발생기 (1316) 는 도 1 을 참조하여 설명된 바와 같이, 하나 이상의 입력 인터페이스들 (1312) 을 통해서 수신된 입력 오디오 신호들에 기초하여, 오디오 신호들을 발생시키도록 구성된다. 예를 들어, 신호 발생기 (1316) 는 제 1 오디오 신호 (1330) 및 제 2 오디오 신호 (1332) 에 기초하여 미드 신호 (1311) 를 발생시키도록 구성될 수도 있다. 다른 예로서, 신호 발생기 (1316) 는 제 1 오디오 신호 (1330) 및 제 2 오디오 신호 (1332) 에 기초하여 사이드 신호 (1313) 를 발생시키도록 구성될 수도 있다. 신호 발생기 (1316) 는 또한 하나 이상의 오디오 신호들을 인코딩하도록 구성될 수도 있다. 예를 들어, 신호 발생기 (1316) 는 미드 신호 (1311) 에 기초하여 인코딩된 미드 신호 (1315) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 미드 신호 (1311), 사이드 신호 (1313), 및 인코딩된 미드 신호 (1315) 는 도 1 의, 미드 신호 (111), 사이드 신호 (113), 및 인코딩된 미드 신호 (115) 또는 도 2 의, 미드 신호 (211), 사이드 신호 (213), 및 인코딩된 미드 신호 (215) 를 각각 포함하거나 또는 이에 대응한다. 신호 발생기 (1316) 는 미드 신호 (1311) 및 사이드 신호 (1313) 를 ICP 발생기 (1320) 로 제공하고 인코딩된 미드 신호 (1315) 를 비트스트림 발생기 (1322) 로 제공하도록 추가로 구성될 수도 있다. 특정의 구현예에서, 인코더 (1314) 는 미드 신호 (1311) 및 사이드 신호 (1313) 를 제공하기 전에 (예컨대, 채널간 예측 이득 파라미터를 발생시키기 전에) 하나 이상의 필터들을 미드 신호 (1311) 및 사이드 신호 (1313) 에 적용하도록 구성될 수도 있다.
ICP 발생기 (1320) 는 미드 신호 (1311) 및 사이드 신호 (1313) 에 기초하여 채널간 예측 이득 파라미터 (ICP) (1308) 를 발생시키도록 구성된다. 예를 들어, ICP 발생기 (1320) 는 도 3 을 참조하여 설명된 바와 같이, 사이드 신호 (1313) 의 에너지에 기초하여 또는 미드 신호 (1311) 의 에너지 및 사이드 신호 (1313) 의 에너지에 기초하여, ICP (1308) 를 발생시키도록 구성될 수도 있다. 대안적으로, ICP 발생기 (1320) 는 도 3 을 참조하여 설명된 바와 같이, 미드 신호 (1311) 및 사이드 신호 (1313) 에 대해 수행되는 동작 (예컨대, 내적 동작) 에 기초하여 ICP (1308) 를 결정하도록 구성될 수도 있다. 단일 ICP (1308) 파라미터가 발생되는 것으로 예시되지만, 다른 구현예들에서, 다수의 ICP 파라미터들이 발생될 수도 있다. 구체적인 예로서, 미드 신호 (1311) 및 사이드 신호 (1313) 는 다수의 대역들로 필터링될 수도 있으며, 도 3 을 참조하여 설명된 바와 같이, 다수의 대역들의 각각에 대응하는 ICP 가 발생될 수도 있다. ICP 발생기 (1320) 는 ICP (1308) 를 비트스트림 발생기 (1322) 로 제공하도록 추가로 구성될 수도 있다.
비트스트림 발생기 (1322) 는 인코딩된 미드 신호 (1315) 를 수신하고 (다른 파라미터들에 추가하여) 인코딩된 오디오 신호를 나타내는 하나 이상의 비트스트림 파라미터들 (1302) 을 발생시키도록 구성될 수도 있다. 예를 들어, 인코딩된 오디오 신호는 인코딩된 미드 신호 (1315) 를 포함하거나 또는 이에 대응할 수도 있다. 비트스트림 발생기 (1322) 는 또한 ICP (1308) 를 하나 이상의 비트스트림 파라미터들 (1302) 에 포함시키도록 구성될 수도 있다. 대안적으로, 비트스트림 발생기 (1322) 는 ICP (1308) 가 하나 이상의 비트스트림 파라미터들 (1302) 로부터 유도될 수 있도록 하나 이상의 비트스트림 파라미터들 (1302) 을 발생시키도록 구성될 수도 있다. 일부 구현예들에서, 상관 파라미터 (1309) 는 도 15 를 참조하여 추가로 설명되는 바와 같이, 하나 이상의 비트스트림 파라미터들 (1302) 에 포함되거나, 이에 의해 표시되거나, 또는 추가하여 전송될 수도 있다. 송신기 (1310) 는 ICP (1308) (및 옵션적으로 상관 파라미터 (1309)) 를 포함하는 (또는, 이에 추가하여) 하나 이상의 비트스트림 파라미터들 (1302) (예컨대, 인코딩된 미드 신호 (1315)) 을 네트워크 (1305) 를 통해서 제 2 디바이스 (1306) 로 전송하도록 구성될 수도 있다. 특정의 구현예에서, 하나 이상의 비트스트림 파라미터들 (1302) 은 도 1 의 하나 이상의 비트스트림 파라미터들 (102) 을 포함하거나 또는 이에 대응하며, ICP (1308) (및 옵션적으로, 상관 파라미터 (1309)) 는 도 1 의 하나 이상의 비트스트림 파라미터들 (102) 에 포함되는 (또는, 이에 추가하여 전송되는) 하나 이상의 코딩 파라미터들 (140) 에 포함된다.
제 2 디바이스 (1306) 는 디코더 (1318) 및 수신기 (1360) 를 포함할 수도 있다. 수신기 (1360) 는 제 1 디바이스 (1304) 로부터 네트워크 (1305) 를 통해서 ICP (1308) 및 하나 이상의 비트스트림 파라미터들 (1302) (예컨대, 인코딩된 미드 신호 (1315)) 을 수신하도록 구성될 수도 있다. 일부 구현예들에서, 수신기 (1360) 는 상관 파라미터 (1309) 를 수신하도록 구성된다. 디코더 (1318) 는 오디오 신호들을 업믹싱 및 디코딩하도록 구성될 수도 있다. 예시하기 위하여, 디코더 (1318) 는 (ICP (1308) 및 옵션적으로 상관 파라미터 (1309) 를 포함하는) 하나 이상의 비트스트림 파라미터들 (1302) 에 기초하여 하나 이상의 오디오 신호들을 디코딩 및 업믹싱하도록 구성될 수도 있다.
디코더 (1318) 는 신호 발생기 (1374), 필터 (1375), 및 업믹서 (1390) 를 포함할 수도 있다. 특정의 구현예에서, 신호 발생기 (1374) 는 도 1 의 신호 발생기 (174) 또는 도 2 의 신호 발생기 (274) 를 포함하거나 또는 이에 대응한다. 신호 발생기 (1374) 는 (하나 이상의 비트스트림 파라미터들 (1302) 에 의해 표시되거나 또는 이에 대응하는) 인코딩된 미드 신호 (1325) 에 기초하여 합성된 미드 신호 (1352) 를 발생시키도록 구성될 수도 있다.
신호 발생기 (1374) 는 합성된 미드 신호 (1352) 및 ICP (1308) 에 기초하여 중간 합성된 사이드 신호 (1354) 를 발생시키도록 추가로 구성될 수도 있다. 비한정적인 예들로서, 신호 발생기 (1374) 는 도 4 를 참조하여 설명된 바와 같이, ICP (1308) 를 합성된 미드 신호 (1352) 에 적용함으로써 (예컨대, 합성된 미드 신호 (1352) 를 ICP (1308) 로 곱함으로써) 또는 ICP (1308) 및 하나 이상의 에너지 레벨들에 기초하여, 중간 합성된 사이드 신호 (1354) 를 발생시키도록 구성될 수도 있다. 필터 (1375) 는 중간 합성된 사이드 신호 (1354) 를 필터링하여 합성된 사이드 신호 (1355) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 필터 (1375) 는 도 14 를 참조하여 추가로 설명되는 바와 같이, 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관), 잔향, 및 스테레오 확장을 수행하도록 구성된 "전역-통과" 필터를 포함한다. 디코더 (1318) 는 추가로 프로세싱하도록 구성될 수도 있으며, 업믹서 (1390) 는 합성된 미드 신호 (1352) 및 합성된 사이드 신호 (1355) 를 업믹싱하여 예컨대, 하나 이상의 라우드스피커들로 렌더링하여 출력될 수도 있는 하나 이상의 출력 오디오 신호들을 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 출력 오디오 신호들은 좌측 오디오 신호 및 우측 오디오 신호를 포함한다. 일부 구현예들에서, 하나 이상의 불연속성 감소 동작들이 도 14 를 참조하여 추가로 설명되는 바와 같이, 업믹싱 및 추가적인 프로세싱 이전에, 합성된 사이드 신호 (1355) 를 이용하여 선택적으로 수행될 수도 있다.
동작 동안, 제 1 디바이스 (1304) 는 하나 이상의 입력 인터페이스들 (1312) 의 제 1 입력 인터페이스를 통해서 제 1 오디오 신호 (1330) 를 수신할 수도 있으며, 하나 이상의 입력 인터페이스들 (1312) 의 제 2 입력 인터페이스를 통해서 제 2 오디오 신호 (1332) 를 수신할 수도 있다. 제 1 오디오 신호 (1330) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (1332) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다. 인코더 (1314) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (1330) 와 제 2 오디오 신호 (1332) 사이의 시간 시프트 또는 시간 지연을 고려하기 위해 하나 이상의 정렬 동작들을 수행할 수도 있다. 인코더 (1314) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (1330) 및 제 2 오디오 신호 (1332) 에 기초하여 미드 신호 (1311) 및 사이드 신호 (1313) 를 발생시킬 수도 있다. 미드 신호 (1311) 및 사이드 신호 (1313) 는 ICP 발생기 (1320) 로 제공될 수도 있다. 신호 발생기 (1316) 는 또한 미드 신호 (1311) 를 인코딩하여, 비트스트림 발생기 (1322) 로 제공되는 인코딩된 미드 신호 (1315) 를 발생시킬 수도 있다.
ICP 발생기 (1320) 는 도 2 내지 도 3 을 참조하여 설명된 바와 같이, 미드 신호 (1311) 및 사이드 신호 (1313) 에 기초하여 ICP (1308) 를 발생시킬 수도 있다. ICP (1308) 는 비트스트림 발생기 (1322) 로 제공될 수도 있다. 일부 구현예들에서, ICP (1308) 는 도 3 을 참조하여 설명된 바와 같이, 이전 프레임들과 연관된 채널간 예측 이득 파라미터들에 기초하여 평활화될 수도 있다. 일부 구현예들에서, ICP 발생기 (1320) 는 또한 상관 파라미터 (1309) 를 발생시킬 수도 있다. 상관 파라미터 (1309) 는 미드 신호 (1311) 와 사이드 신호 (1313) 사이의 상관을 나타낼 수도 있다.
비트스트림 발생기 (1322) 는 인코딩된 미드 신호 (1315) 및 ICP (1308) (및 옵션적으로 상관 파라미터 (1309)) 를 수신하여 하나 이상의 비트스트림 파라미터들 (1302) 을 발생시킬 수도 있다. 하나 이상의 비트스트림 파라미터들 (1302) 은 비트스트림 (예컨대, 인코딩된 미드 신호 (1315)) 및 ICP (1308) (및 옵션적으로 상관 파라미터 (1309)) 를 포함한다. 대안적으로, 하나 이상의 비트스트림 파라미터들 (1302) 은 ICP (1308) (및 옵션적으로 상관 파라미터 (1309)) 가 유도될 수 있게 하는 하나 이상의 파라미터들을 포함한다. (ICP (1308) 및 옵션적으로 상관 파라미터 (1309) 를 포함하거나 또는 표시하는) 하나 이상의 비트스트림 파라미터들 (1302) 은 송신기 (1310) 에 의해 네트워크 (1305) 를 통해서 제 2 디바이스 (1306) 로 전송된다.
제 2 디바이스 (1306) (예컨대, 수신기 (1360)) 는 ICP (1308) (및 옵션적으로 상관 파라미터 (1309)) 를 포함하는 (또는, 표시하는) (인코딩된 미드 신호 (1315) 를 표시하는) 하나 이상의 비트스트림 파라미터들 (1302) 을 수신할 수도 있다. 디코더 (1318) 는 도 2 를 참조하여 설명된 바와 같이, 하나 이상의 비트스트림 파라미터들 (1302) 에 기초하여 인코딩된 미드 신호 (1325) 를 결정할 수도 있다. 신호 발생기 (1374) 는 인코딩된 미드 신호 (1325) 에 기초하여 (또는, 하나 이상의 비트스트림 파라미터들 (1302) 로부터 직접) 합성된 미드 신호 (1352) 를 발생시킬 수도 있다. 신호 발생기 (1374) 는 또한 합성된 미드 신호 (1352) 및 ICP (1308) 에 기초하여 중간 합성된 사이드 신호 (1354) 를 발생시킬 수도 있다. 비한정적인 예들로서, 신호 발생기 (1374) 는 도 4 를 참조하여 설명된 바와 같이, 합성된 미드 신호 (1352) 를 ICP (1308) 로 곱함으로써 또는 합성된 미드 신호 (1352), ICP (1308), 및 에너지 레벨에 기초하여, 중간 합성된 사이드 신호 (1354) 를 발생시킨다.
중간 합성된 사이드 신호 (1354) 를 발생시킨 후, 중간 합성된 사이드 신호 (1354) 는 합성된 사이드 신호 (1355) 를 발생시키기 위해 필터 (1375) (예컨대, 전역-통과 필터) 에 의해 필터링될 수도 있다. 필터 (1375) 를 적용하는 것은 합성된 미드 신호 (1352) 와 합성된 사이드 신호 (1355) 사이의 상관을 감소시킬 (예컨대, 비상관을 증가시킬) 수도 있다. 일부 구현예들에서, 상관 파라미터 (1309) 는 도 15 를 참조하여 추가로 설명되는 바와 같이, 필터 (1375) 를 구성하는데 사용된다. 일부 구현예들에서, 상이한 신호 대역들에 대응하는 다수의 ICP들이 수신되며, 도 16 을 참조하여 추가로 설명되는 바와 같이, 중간 합성된 사이드 신호들의 다수의 대역들이 필터 (1375) 를 이용하여 필터링될 수도 있다. 합성된 사이드 신호 (1355) 를 발생시킨 후, 디코더 (1318) 는 합성된 미드 신호 (1352) 및 합성된 사이드 신호 (1355) 에 대해 추가적인 프로세싱, 및 필터링을 수행할 수도 있으며, 업믹서 (1390) 는 합성된 미드 신호 (1352) 및 합성된 사이드 신호 (1355) 를 업믹싱하여 제 1 오디오 신호 및 제 2 오디오 신호를 발생시킬 수도 있다. 일부 구현예들에서, 하나 이상의 불연속성 억제 동작들이 도 14 를 참조하여 추가로 설명되는 바와 같이, 제 1 오디오 신호 및 제 2 오디오 신호의 발생 전에, 합성된 사이드 신호 (1355) 를 이용하여 수행될 수도 있다.
특정의 구현예에서, 제 1 오디오 신호는 좌측 신호 또는 우측 신호 중 하나에 대응하며, 제 2 오디오 신호는 좌측 신호 또는 우측 신호 중 다른 하나에 대응한다. 특정의 구현예에서, 좌측 신호는 합성된 미드 신호 (1352) 와 합성된 사이드 신호 (1355) 의 총합에 기초하여 발생될 수도 있으며, 우측 신호는 합성된 미드 신호 (1352) 와 합성된 사이드 신호 (1355) 사이의 차이에 기초하여 발생될 수도 있다. 합성된 미드 신호 (1352) 와 합성된 사이드 신호 (1355) 사이의 상관을 감소시키는 것은 좌측 신호 및 우측 신호에 의해 나타내어지는 공간 오디오 정보를 향상시킬 수도 있다. 예시하기 위하여, 합성된 미드 신호 (1352) 및 합성된 사이드 신호 (1355) 가 고도로 상관되면, 좌측 신호는 합성된 미드 신호 (1352) 의 2배에 근접할 수도 있으며, 우측 신호는 널 신호에 근접할 수도 있다. 합성된 미드 신호 (1352) 와 합성된 사이드 신호 (1355) 사이의 상관을 감소시키는 것은 신호들 사이의 공간 차이들을 증가시킬 수도 있으며, 이는 공간적으로 상이한 좌측 신호 및 우측 신호를 초래할 수도 있으며, 이는 청취자의 경험을 향상시킬 수도 있다.
도 13 의 시스템 (1300) 은 디코더에서, 합성된 미드 신호 및 예측된 합성된 사이드 신호 (예컨대, 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초한 합성된 사이드 신호) 의 비상관을 가능하게 한다. 합성된 미드 신호 및 합성된 사이드 신호를 비상관시키는 것은 공간 차이들을 가지는 오디오 신호들 (예컨대, 좌측 신호 및 우측 신호) 의 발생을 가능하게 한다. 공간 차이들을 가지는 좌측 신호들 및 우측 신호들은 마치 이들이 2개의 상이한 로케이션들로부터 나오는 것처럼 들리며, 이는 공간 차이들이 없는 (예컨대, 고도로 상관된 신호들에 기초하는), 따라서 단일 로케이션 (예컨대, 하나의 스피커) 으로부터 나오는 것처럼 들리는 신호들과 비교하여, 청취자 경험을 향상시킨다.
도 14 는 도 13 의 시스템 (1300) 의 디코더 (1418) 의 제 1 예시적인 예를 예시하는 다이어그램이다. 예를 들어, 디코더 (1418) 는 도 13 의 디코더 (1318) 를 포함하거나 또는 이에 대응할 수도 있다.
디코더 (1418) 는 비트스트림 프로세싱 회로부 (1424), 미드 신시사이저 (1452) 및 사이드 신시사이저 (1456) 를 포함하는 신호 발생기 (1450), 및 전역-통과 필터 (1430) 를 포함한다. 비트스트림 프로세싱 회로부 (1424) 는 신호 발생기 (1450) 에 커플링될 수도 있으며, 신호 발생기 (1450) 는 전역-통과 필터 (1430) 에 커플링될 수도 있다.
디코더 (1418) 는 옵션적으로, 에너지 검출기 (1460), 하나 이상의 필터들 (1468), 업샘플러 (1464), 및 불연속성 억제기 (1466) 를 포함할 수도 있다. 에너지 검출기 (1460) 는 신호 발생기 (1450) 에 (예컨대, 미드 신시사이저 (1452) 및 사이드 신시사이저 (1456) 에) 커플링될 수도 있다. 하나 이상의 필터들 (1468), 업샘플러 (1464), 및 불연속성 억제기 (1466) 는 전역-통과 필터 (1430) 와 디코더 (1418) 의 출력 사이에 커플링될 수도 있다. 에너지 검출기 (1460), 하나 이상의 필터들 (1468), 업샘플러 (1464), 및 불연속성 억제기 (1466) 의 각각은 옵션적이며, 따라서, 디코더 (1418) 의 일부 구현예들에서는 포함되지 않을 수도 있다.
비트스트림 프로세싱 회로부 (1424) 는 (ICP (1408) 를 포함하는) 하나 이상의 비트스트림 파라미터들 (1402) 을 프로세싱하여 하나 이상의 비트스트림 파라미터들 (1402) 로부터 특정의 파라미터들을 추출하도록 구성될 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (1424) 는 도 4 를 참조하여 설명된 바와 같이, ICP (1408) 및 하나 이상의 인코딩된 미드 신호 파라미터들 (1426) 을 추출하도록 구성될 수도 있다. 비트스트림 프로세싱 회로부 (1424) 는 ICP (1408) 및 하나 이상의 인코딩된 미드 신호 파라미터들 (1426) 을 신호 발생기 (1450) 로 제공하도록 구성될 수도 있다 (예컨대, ICP (1408) 가 사이드 신시사이저 (1456) 로 제공될 수도 있으며, 하나 이상의 인코딩된 미드 신호 파라미터들 (1426) 이 미드 신시사이저 (1452) 로 제공될 수도 있다). 일부 구현예들에서, 디코더 (1418) 는 코딩 모드 파라미터 (1407) 를 수신할 수도 있으며, 비트스트림 프로세싱 회로부 (1424) 는 코딩 모드 파라미터 (1407) 를 추출하여 코딩 모드 파라미터 (1407) 를 전역-통과 필터 (1430) 로 제공하도록 구성될 수도 있다.
신호 발생기 (1450) 는 하나 이상의 인코딩된 미드 신호 파라미터들 (1426) 및 ICP (1408) 에 기초하여 오디오 신호들을 발생시키도록 구성될 수도 있다. 예시하기 위하여, 도 4 를 참조하여 설명된 바와 같이, 미드 신시사이저 (1452) 는 인코딩된 미드 신호 파라미터들 (1426) 에 기초하여 (예컨대, 인코딩된 미드 신호에 기초하여) 합성된 미드 신호 (1470) 를 발생시키도록 구성될 수도 있으며, 사이드 신시사이저 (1456) 는 합성된 미드 신호 (1470) 및 ICP (1408) 에 기초하여 중간 합성된 사이드 신호 (1471) 를 발생시키도록 구성될 수도 있다. 특정의 구현예에서, 도 4 를 참조하여 설명된 바와 같이, 에너지 검출기 (1460) 는 합성된 미드 신호 (1470) 에 기초하여, 합성된 미드 에너지 레벨 (1462) 을 검출하도록 구성되며, 사이드 신시사이저 (1456) 는 합성된 미드 신호 (1470), ICP (1408), 및 합성된 미드 에너지 레벨 (1462) 에 기초하여 중간 합성된 사이드 신호 (1471) 를 발생시키도록 구성된다.
전역-통과 필터 (1430) 는 중간 합성된 사이드 신호 (1471) 를 필터링하여 합성된 사이드 신호 (1472) 를 발생시키도록 구성될 수도 있다. 예를 들어, 전역-통과 필터 (1430) 는 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관), 잔향, 및 스테레오 확장을 수행하도록 구성될 수도 있다. 예시하기 위하여, 전역-통과 필터 (1430) 는 인코더에서 (예컨대, 송신 측에서) 추정된 스테레오 폭의 효과들을 합성하기 위해 위상 조정 또는 블러링 (blurring) 을 수행할 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1430) 는 다중 스테이지 캐스케이드된 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관) 필터들을 포함한다. 전역-통과 필터 (1430) 는 시간 도메인에서 중간 합성된 사이드 신호 (1471) 를 필터링하여 합성된 사이드 신호 (1472) 를 발생시키도록 구성될 수도 있다. 디코더 (1418) 에서 시간-도메인에서 위상 조정을 수행한 후 낮은 비트 레이트들에서의 시간 업-믹싱 및 합성을 수행하는 것은 밸런싱에 도움이 될 수도 있으며, 신호 코딩 효율과 스테레오 이미지 확장 사이의 상충관계를 향상시킬 수도 있다. 이러한 CP 파라미터들의 밸런싱은 다수의 마이크로폰들로부터의 음악 및 음성 양자의 리코딩들의 향상된 코딩을 초래할 수도 있다. 전역-통과 필터 (1430) 는 필터링된 신호의 크기가 상이한 주파수들에 걸쳐서 동일하도록 (또는, 대략 동일하도록) 전역-통과 필터 (1430) 의 주파수 응답이 단일 (또는, 근사) 이기 때문에 전역-통과 필터로서 지칭된다. 전역-통과 필터 (1430) 는 필터링된 신호의 위상이 상이한 주파수들에 걸쳐서 변하도록 주파수에 따라 변하는 위상 응답을 가질 수도 있다.
예컨대, 위상 조정 또는 블러링, 잔향 추가, 및 스테레오 이미지 확장에 의해, 입력 신호 (예컨대, 중간 합성된 사이드 신호 (1471)) 에 대해 필터링된 신호 (예컨대, 합성된 사이드 신호 (1472)) 의 위상을 변화시킴으로써, 전역-통과 필터 (1430) 는 합성된 사이드 신호 (1472) 와 합성된 미드 신호 (1470) 사이의 상관을 감소시키도록 (예컨대, 비상관을 증가시키도록) 구성된다. 예시하기 위하여, 중간 합성된 사이드 신호 (1471) 가 합성된 미드 신호 (1470) 로부터 발생되기 때문에, 중간 합성된 사이드 신호 (1471) 및 합성된 미드 신호 (1470) 는 고도로 상관될 수도 있으며, 이는 공간 차이들이 없는 출력 오디오 신호들을 초래할 수 있다. 중간 합성된 사이드 신호 (1471) 의 위상에 대해 합성된 사이드 신호 (1472) 의 위상을 변화시킴으로써, 전역-통과 필터 (1430) 는 합성된 사이드 신호 (1472) 와 합성된 미드 신호 (1470) 사이의 상관을 감소시킬 수도 있으며, 이는 출력 오디오 신호들 사이의 공간 차이를 증가시킬 수도 있으며, 이에 의해 청취 경험을 향상시킬 수도 있다.
일부 구현예들에서, 전역-통과 필터 (1430) 는 단일 스테이지를 포함한다. 다른 구현예들에서, 전역-통과 필터 (1430) 는 직렬로 커플링된 다수의 스테이지들을 포함한다. 예시하기 위하여, 전역-통과 필터 (1430) 는 제 1 스테이지, 제 2 스테이지, 제 3 스테이지, 및 제 4 스테이지를 포함할 수도 있다. 다른 구현예들에서, 전역-통과 필터 (1430) 는 4개 미만 또는 4개 초과의 스테이지들을 포함한다. 스테이지들은 직렬로 (예컨대, 계단식으로) 커플링될 수도 있다. 스테이지들의 각각의 스테이지는 스테이지에 의해 제공되는 지연의 양 (예컨대, 위상 조정) 을 제어하는 지연 파라미터 및 스테이지에 의해 제공되는 이득의 양 (예컨대, 크기 조정) 을 제어하는 이득 파라미터와 연관될 수도 있다. 예를 들어, 제 1 스테이지는 제 1 지연 파라미터 및 제 1 이득 파라미터와 연관될 수도 있으며, 제 2 스테이지는 제 2 지연 파라미터 및 제 2 이득 파라미터와 연관될 수도 있으며, 제 3 스테이지는 제 3 지연 파라미터 및 제 3 이득 파라미터와 연관될 수도 있으며, 제 4 스테이지는 제 4 지연 파라미터 및 제 4 이득 파라미터와 연관될 수도 있다. 일부 구현예들에서, 스테이지들의 각각은 고정된다. 예를 들어, 지연 파라미터들의 값들 및 이득 파라미터들의 값들은 예컨대, 디코더 (1418) 의 구성 또는 셋업 단계 동안 동일한 또는 상이한 값들로 설정될 수도 있다. 다른 구현예들에서, 스테이지들의 각각의 스테이지는 개별적으로 구성가능할 수도 있다. 예를 들어, 각각의 스테이지가 개별적으로 인에이블링될 (또는, 디스에이블링될) 수도 있거나, 다수의 스테이지들과 연관된 파라미터들 중 하나 이상이 개별적으로 설정될 (또는, 조정될) 수도 있거나, 또는 이들의 조합일 수도 있다. 예를 들어, 파라미터들 중 하나 이상이 본원에서 추가로 설명되는 바와 같이, ICP (1408) 에 기초하여 설정될 (또는, 조정될) 수도 있다.
특정의 구현예에서, 전역-통과 필터 (1430) 는 정지된 전역-통과 필터를 포함한다. 예를 들어, 전역-통과 필터 (1430) 와 연관된 파라미터들은 고정된 값들로 설정될 (또는, 조정될) 수도 있다. 다른 특정의 구현예에서, 전역-통과 필터 (1430) 는 비-정지된 전역-통과 필터를 포함한다. 예를 들어, 전역-통과 필터 (1430) 와 연관된 파라미터들은 시간에 걸쳐서 변하는 값들로 설정될 (또는, 조정될) 수도 있다.
특정의 구현예에서, 전역-통과 필터 (1430) 는 코딩 모드 파라미터 (1407) 에 추가로 기초하여 중간 합성된 사이드 신호 (1471) 를 필터링하도록 구성될 수도 있다. 예를 들어, 전역-통과 필터 (1430) 와 연관된 파라미터들 중 하나 이상이 본원에서 추가로 설명되는 바와 같이, 코딩 모드 파라미터 (1407) 의 값에 기초하여 설정될 (또는, 조정될) 수도 있다. 다른 예로서, 전역-통과 필터 (1430) 의 스테이지들 중 하나 이상이 본원에서 추가로 설명되는 바와 같이, 코딩 모드 파라미터 (1407) 에 기초하여 인에이블링될 (또는, 디스에이블링될) 수도 있다.
특정의 구현예에서, 하나 이상의 필터들 (1468) 은 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 수신하여, 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자를 필터링하도록 구성된다. 하나 이상의 필터들 (1468) 은 하나 이상의 유형들의 필터들을 포함할 수도 있다. 예를 들어, 하나 이상의 필터들 (1468) 은 디-엠퍼시스 필터들, 대역통과 필터들, FFT 필터들 (또는, 변환들), IFFT 필터들 (또는, 변환들), 시간 도메인 필터들, 주파수 또는 서브밴드 도메인 필터들, 또는 이들의 조합을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (1468) 은 하나 이상의 고정된 필터들을 포함한다. 대안적으로, 하나 이상의 필터들 (1468) 은 도 4 를 참조하여 설명된 바와 같이, 다른 디바이스로부터 수신된 하나 이상의 적응 필터 계수들에 기초하여, 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자를 필터링하도록 구성된 하나 이상의 적응 필터들을 포함할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (1468) 은 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자에 대해 디-엠퍼시스 필터링을 수행하도록 구성된 디-엠퍼시스 필터 및 50 Hz 고역 통과 필터를 포함한다.
특정의 구현예에서, 업샘플러 (1464) 는 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 업샘플링하도록 구성된다. 예를 들어, 업샘플러 (1464) 는 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 (합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 가 발생되는) 다운샘플링된 레이트로부터 업샘플링된 레이트 (예컨대, 인코더에서 수신되어 하나 이상의 비트스트림 파라미터들 (1402) 을 발생시키는데 사용되는 오디오 신호들의 입력 샘플링 레이트) 로 업샘플링하도록 구성될 수도 있다. 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 업샘플링하는 것은 오디오 신호들의 플레이백과 연관된 출력 샘플링 레이트에서의 오디오 신호들의 (예컨대, 디코더 (1418) 에 의한) 발생을 가능하게 한다.
특정의 구현예에서, 불연속성 억제기 (1466) 는 수신기에서 수신되는 (그리고 디코더 (1418) 로 제공되는) 인코딩된 사이드 신호에 기초하여 발생되는 제 2 합성된 사이드 신호의 제 2 프레임과 합성된 사이드 신호 (1472) 의 제 1 프레임 사이의 불연속성을 감소시키도록 (또는, 제거하도록) 구성될 수도 있다. 예시하기 위하여, 제 1 프레임을 포함하는 프레임들의 제 1 세트에 대해, (인코더를 포함하는) 다른 디바이스는 ICP (1408) 및 하나 이상의 비트스트림 파라미터들 (1402) (예컨대, 인코딩된 미드 신호) 을 전송할 수도 있다. 예를 들어, 프레임들의 제 1 세트는 디코더 (1418) 가 ICP (1408) 에 기초하여 합성된 사이드 신호 (1472) 를 예측해야 한다는 결정과 연관될 수도 있다. 제 2 프레임을 포함하는 프레임들의 제 2 세트에 대해, 다른 디바이스는 ICP (1408) 대신, 인코딩된 사이드 신호를 전송할 수도 있다. 예를 들어, 프레임들의 제 2 세트는 디코더 (1418) 가 제 2 합성된 사이드 신호를 발생시키기 위해 인코딩된 사이드 신호를 디코딩해야 한다는 결정과 연관될 수도 있다. 일부의 경우, 불연속성이 합성된 사이드 신호 (1472) 와 디코딩된 사이드 신호 사이에 존재할 수도 있다 (예컨대, 합성된 사이드 신호 (1472) 의 제 1 프레임은 디코딩된 사이드 신호의 제 2 프레임과는, 이득, 피치, 또는 어떤 다른 특성에서 상대적으로 상이할 수도 있다. 디코더 (1418) 가 합성된 사이드 신호 (1472) 를 예측하는 것으로부터, 수신된 인코딩된 사이드 신호를 디코딩하는 것으로 스위칭할 때, 또는 디코더 (1418) 가 수신된 인코딩된 사이드 신호를 디코딩하는 것으로부터 합성된 사이드 신호 (1472) 를 예측하는 것으로 스위칭할 때, 불연속들이 존재할 수도 있다.
일부 구현예들에서, 불연속성 억제기 (1466) 는 합성된 사이드 신호 (1472) 를 예측하는 것으로부터 디코딩하여 제 2 합성된 사이드 신호 (예컨대, 디코딩된 사이드 신호) 를 발생시키는 것으로 스위칭할 때 불연속들을 감소시키도록 구성된다. 특정의 구현예에서, 불연속성 억제기 (1466) 는 합성된 사이드 신호 (1472) 의 하나 이상의 프레임들을 제 2 합성된 사이드 신호의 하나 이상의 프레임들과 교차-페이딩하도록 구성될 수도 있다. 예를 들어, 제 1 값 (예컨대, 1) 내지 제 2 값 (예컨대, 0) 의 범위인 제 1 슬라이딩 윈도우가 합성된 사이드 신호 (1472) 의 하나 이상의 프레임들에 적용될 수도 있으며, 제 2 값 내지 제 1 값의 범위인 제 2 슬라이딩 윈도우가 제 2 합성된 사이드 신호의 하나 이상의 프레임들에 적용될 수도 있으며, 프레임들은 합성된 사이드 신호 (1472) 를 "테이퍼 아웃 (taper out)"하고 제 2 합성된 사이드 신호를 "테이퍼 인 (taper in)" 하도록 결합될 수도 있다. 다른 특정의 구현예에서, 불연속성 억제기 (1466) 는 하나 이상의 프레임들에 대한 제 2 합성된 사이드 신호의 발생을 연기하도록 구성될 수도 있다. 예를 들어, 불연속성 억제기 (1466) 는 불연속성이 회피되어야 하는 하나 이상의 특정의 프레임들을 식별할 수도 있으며, 불연속성 억제기 (1466) 는 하나 이상의 특정의 프레임들에 대한 합성된 사이드 신호 (1472) 를 예측할 수도 있다. 일 예로서, 불연속성 억제기 (1466) 는 최종 수신된 채널간 예측 이득 파라미터를 합성된 미드 신호 (1470) 의 하나 이상의 특정의 프레임들에 적용하여 하나 이상의 특정의 프레임들에 대한 합성된 사이드 신호 (1472) 를 발생시킬 수도 있다. 다른 예로서, 불연속성 억제기 (1466) 는 합성된 미드 신호 (1470) 및 제 2 합성된 사이드 신호 (예컨대, 디코딩된 사이드 신호) 에 기초하여 채널간 예측 이득 파라미터를 추정할 수도 있으며, 불연속성 억제기는 추정된 채널간 예측 이득 파라미터를 이용하여 합성된 사이드 신호 (1472) 를 발생시킬 수도 있다. 다른 특정의 구현예에서, 디코더 (1418) 는 하나 이상의 프레임들에 대한 인코딩된 사이드 신호 및 ICP (1408) 를 수신할 수도 있으며, 불연속성 억제기 (1466) 는 합성된 사이드 신호 (1472) 및 제 2 합성된 사이드 신호를 교차-페이딩할 수도 있다.
일부 구현예들에서, 불연속성 억제기 (1466) 는 디코딩하여 제 2 합성된 사이드 신호 (예컨대, 디코딩된 사이드 신호) 를 발생시키는 것으로부터 합성된 사이드 신호 (1472) 를 예측하는 것으로 스위칭할 때 불연속들을 감소시키도록 구성된다. 특정의 구현예에서, 불연속성 억제기 (1466) 는 제 2 합성된 신호의 미러링된 샘플들을 발생시키도록 구성될 수도 있다. 미러링된 샘플들은 역방향 순서로 발생될 수도 있다 (예컨대, 제 1 미러링된 샘플은 제 2 합성된 신호의 최종 샘플로부터 미러링될 수도 있으며, 제 2 미러링된 샘플은 제 2 합성된 신호의 제 2-내지-최종 샘플로부터 미러링될 수도 있으며, 기타등등일 수도 있다). 불연속성 억제기 (1466) 는 미러링된 샘플들을 하나 이상의 프레임들에 대한 합성된 사이드 신호 (1472) 과 교차-페이딩하도록 추가로 구성될 수도 있다. 따라서, 불연속성 억제기 (1466) 는 디코더 (1418) 에서 사이드 신호를 발생시키는 방법이 (예컨대, 예측으로부터 디코딩으로 또는 디코딩으로부터 예측으로) 변화되는 프레임들에 걸쳐서 불연속들을 감소시키도록 (또는, 제거하도록) 구성될 수도 있으며, 이는 청취 경험을 향상시킬 수도 있다.
특정의 구현예에서, 디코더 (1418) 는 도 1 을 참조하여 설명된 바와 같이, 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 에 대해 업믹싱을 수행하여 출력 신호들을 발생시키도록 추가로 구성된다. 예를 들어, 디코더 (1418) 는 업샘플링된 합성된 미드 신호 (1470) 및 업샘플링된 합성된 사이드 신호 (1472) 에 기초하여 제 1 오디오 신호 (1480) 및 제 2 오디오 신호 (1482) 를 발생시키도록 구성될 수도 있다.
동작 동안, 디코더 (1418) 는 하나 이상의 비트스트림 파라미터들 (1402) 을 (예컨대, 수신기로부터) 수신한다. 하나 이상의 비트스트림 파라미터들 (1402) 은 ICP (1408) 를 포함한다 (또는, 표시한다). 일부 구현예들에서, 하나 이상의 비트스트림 파라미터들 (1402) 은 또한 코딩 모드 파라미터 (1407) 를 포함하거나 또는 이에 추가하여 수신된다. 비트스트림 프로세싱 회로부 (1424) 는 하나 이상의 비트스트림 파라미터들 (1402) 을 프로세싱하여 다양한 파라미터들을 추출할 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (1424) 는 하나 이상의 비트스트림 파라미터들 (1402) 로부터 인코딩된 미드 신호 파라미터들 (1426) 을 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1424) 는 인코딩된 미드 신호 파라미터들 (1426) 을 신호 발생기 (1450) 로 (예컨대, 미드 신시사이저 (1452) 로) 제공할 수도 있다. 다른 예로서, 비트스트림 프로세싱 회로부 (1424) 는 하나 이상의 비트스트림 파라미터들 (1402) 로부터 ICP (1408) 를 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1424) 는 ICP (1408) 를 신호 발생기 (1450) 로 (예컨대, 사이드 신시사이저 (1456) 로) 제공할 수도 있다. 특정의 구현예에서, 비트스트림 프로세싱 회로부 (1424) 는 코딩 모드 파라미터 (1407) 를 추출하고 코딩 모드 파라미터 (1407) 를 전역-통과 필터 (1430) 로 제공할 수도 있다.
미드 신시사이저 (1452) 는 인코딩된 미드 신호 파라미터들 (1426) 에 기초하여 합성된 미드 신호 (1470) 를 발생시킬 수도 있다. 사이드 신시사이저 (1456) 는 합성된 미드 신호 (1470) 및 ICP (1408) 에 기초하여 중간 합성된 사이드 신호 (1471) 를 발생시킬 수도 있다. 비한정적인 예로서, 사이드 신시사이저 (1456) 는 도 4 를 참조하여 설명된 기법들에 따라서 중간 합성된 사이드 신호 (1471) 를 발생시킬 수도 있다.
전역-통과 필터 (1430) 는 중간 합성된 사이드 신호 (1471) 를 필터링하여 합성된 사이드 신호 (1472) 를 발생시킬 수도 있다. 일부 구현예들에서, 합성된 사이드 신호 (1472) 는 다음 수식에 따라서 발생될 수도 있다:
Side_Mapped(z) = HAP(z) Mid_signal_decoded(z) * ICP_Gain
여기서, Side_Mapped(z) 는 합성된 사이드 신호 (1472) 이고, ICP_Gain 은 ICP (1408) 이며, Mid_signal_decoded(z) 는 합성된 미드 신호 (1470) 이고, HAP(z) 는 전역-통과 필터 (1430) 에 의해 적용된 필터링이다.
일부 구현예들에서, HAP(z) 는 다음 수식에 따라서 결정될 수도 있다:
Figure pct00010
여기서, Hi(z) 는 전역-통과 필터 (1430) 의 스테이지 i 에 의해 적용된 필터링이다. 따라서, 전역-통과 필터 (1430) 에 의해 적용되는 필터링은 전역-통과 필터 (1430) 의 스테이지들의 각각에 의해 적용되는 필터링의 곱셈과 동일할 수도 있다.
일부 구현예들에서, Hi(z) 는 다음 수식에 따라서 결정될 수도 있다:
Figure pct00011
여기서, gi 는 전역-통과 필터 (1430) 의 스테이지 i 와 연관된 이득 파라미터이고, Mi 는 전역-통과 필터 (1430) 의 스테이지 i 와 연관된 지연 파라미터이다.
일부 구현예들에서, 전역-통과 필터 (1430) 의 하나 이상의 파라미터들의 값들은 ICP (1408) 에 기초하여 설정될 수도 있다. 예를 들어, ICP (1408) 가 상대적으로 높은 (예컨대, 제 1 임계치를 만족시키는) 것에 기초하여, 파라미터들 중 하나 이상은 전역-통과 필터 (1430) 에 의해 제공되는 비상관의 양을 증가시키는 값들로 설정될 (또는, 조정될) 수도 있다. 다른 예로서, ICP (1408) 가 상대적으로 낮은 (예컨대, 제 2 임계치를 만족시키지 못하는) 것에 기초하여, 파라미터들 중 하나 이상은 전역-통과 필터 (1430) 에 의해 제공되는 비상관의 양을 감소시키는 값들로 설정될 (또는, 조정될) 수도 있다. 다른 구현예들에서, 파라미터들의 값들은 ICP (1408) 에 기초하여 달리 설정되거나 또는 조정될 수도 있다.
특정의 구현예에서, 전역-통과 필터 (1430) 의 스테이지들 중 하나 이상은 코딩 모드 파라미터 (1407) 에 기초하여 인에이블링될 (또는, 디스에이블링될) 수도 있다. 예를 들어, 스테이지들의 각각은 음악 코딩 모드 (예컨대, 변환 코더 (TCX) 모드) 를 표시하는 코딩 모드 파라미터 (1407) 에 기초하여 인에이블링될 수도 있다. 다른 예로서, 제 2 스테이지 및 제 4 스테이지는 음성 코딩 모드 (예컨대, 대수 코드-여기 선형 예측 (ACELP) 코더 모드) 를 표시하는 코딩 모드 파라미터 (1407) 에 기초하여 디스에이블링될 수도 있다. 스테이지들 중 하나 이상을 디스에이블링하는 것은 필터링된 음성 신호들에서의 에코를 감소시킬 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1430) 의 특정의 스테이지를 디스에이블링하는 것은 대응하는 지연 파라미터 및 대응하는 이득 파라미터를 특정의 값 (예컨대, 0) 으로 설정하는 것을 포함할 수도 있다. 다른 구현예들에서, 스테이지들은 다른 방법들로 디스에이블링될 (또는, 인에이블링될) 수도 있다. 코딩 모드 파라미터 (1407) 가 설명되지만, 다른 구현예들에서, 스테이지들은 다른 파라미터들, 예컨대 음성 또는 음악 콘텐츠를 표시하는 다른 파라미터들에 기초하여 디스에이블링될 (또는, 디스에이블링될) 수도 있다.
일부 구현예들에서, 하나 이상의 필터들 (1468) 은 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자를 필터링할 수도 있다. 예를 들어, 하나 이상의 필터들 (1468) 은 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자에 대해 디-엠퍼시스 필터링, 고역 통과 필터링, 또는 양자를 수행할 수도 있다. 특정의 구현예에서, 하나 이상의 필터들 (1468) 은 고정된 필터를 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자에 적용한다. 다른 특정의 구현예에서, 하나 이상의 필터들 (1468) 은 적응 필터를 합성된 미드 신호 (1470), 합성된 사이드 신호 (1472), 또는 양자에 적용한다.
일부 구현예들에서, 업샘플러 (1464) 는 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 업샘플링할 수도 있다. 예를 들어, 업샘플러 (1464) 는 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 를 다운샘플링된 레이트 (예컨대, 대략 0 - 6.4 kHz) 로부터 출력 샘플링 레이트로 업샘플링할 수도 있다. 업샘플링 후, 디코더 (1418) 는 합성된 미드 신호 (1470) 및 합성된 사이드 신호 (1472) 에 기초하여 제 1 오디오 신호 (1480) 및 제 2 오디오 신호 (1482) 를 발생시킬 수도 있다. 예를 들어, 디코더 (1418) 는 도 1 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (1480) 및 제 2 오디오 신호 (1482) 를 업믹싱하여 발생시키도록 수행할 수도 있다. 제 1 오디오 신호 (1480) 및 제 2 오디오 신호 (1482) 는 하나 이상의 출력 디바이스들, 예컨대 하나 이상의 라우드스피커들로 출력될 수도 있다. 특정의 구현예에서, 제 1 오디오 신호 (1480) 는 좌측 오디오 신호 및 우측 오디오 신호 중 하나이고, 제 2 오디오 신호 (1482) 는 좌측 오디오 신호 및 우측 오디오 신호 중 다른 하나이다. 일부 구현예들에서, 불연속성 억제기 (1466) 는 제 1 오디오 신호 (1480) 및 제 2 오디오 신호 (1482) 의 발생 전에 하나 이상의 불연속성 감소 동작들을 수행할 수도 있다.
도 14 의 디코더 (1418) 는 채널간 예측 이득 파라미터들 (예컨대, ICP (1408)) 을 이용한 합성된 미드 신호 (1470) 로부터의 합성된 사이드 신호 (1472) 의 예측 (예컨대, 맵핑) 을 가능하게 한다. 추가적으로, 디코더 (1418) 는 합성된 미드 신호 (1470) 와 합성된 사이드 신호 (1472) 사이의 상관을 감소시키고 (예컨대, 비상관을 증가시키고), 이는 제 1 오디오 신호 (1480) 와 제 2 오디오 신호 (1482) 사이의 공간 차이를 증가시킬 수도 있으며, 이는 청취 경험을 향상시킬 수도 있다.
도 15 는 도 13 의 시스템 (1300) 의 디코더 (1518) 의 제 2 예시적인 예를 예시하는 다이어그램이다. 예를 들어, 디코더 (1518) 는 도 13 의 디코더 (1318) 를 포함하거나 또는 이에 대응할 수도 있다.
디코더 (1518) 는 비트스트림 프로세싱 회로부 (1524), (미드 신시사이저 (1552) 및 사이드 신시사이저 (1556) 를 포함하는) 신호 발생기 (1550), 전역-통과 필터 (1530), 및 옵션적으로 에너지 검출기 (1560) 를 포함할 수도 있다. 특정의 구현예에서, 전역-통과 필터 (1530) 는 제 1 지연 파라미터 및 제 1 이득 파라미터와 연관되는 제 1 스테이지, 제 2 지연 파라미터 및 제 2 이득 파라미터와 연관되는 제 2 스테이지, 제 3 지연 파라미터 및 제 3 이득 파라미터와 연관되는 제 3 스테이지, 및 제 4 지연 파라미터 및 제 4 이득 파라미터와 연관되는 제 4 스테이지를 포함할 수도 있다. 비트스트림 프로세싱 회로부 (1524), 신호 발생기 (1550), 미드 신시사이저 (1552), 사이드 신시사이저 (1556), 에너지 검출기 (1560), 및 전역-통과 필터 (1530) 는 도 14 의, 비트스트림 프로세싱 회로부 (1424), 신호 발생기 (1450), 미드 신시사이저 (1452), 사이드 신시사이저 (1456), 에너지 검출기 (1460), 및 전역-통과 필터 (1430) 를 참조하여 설명된 바와 같은 유사한 동작들을 각각 수행할 수도 있다. 디코더 (1518) 는 또한 사이드 신호 믹서 (1590) 를 포함할 수도 있다. 사이드 신호 믹서 (1590) 는 본원에서 추가로 설명되는 바와 같이, 상관 파라미터에 기초하여 중간 합성된 사이드 신호 및 필터링된 합성된 사이드 신호를 믹싱하도록 구성될 수도 있다.
동작 동안, 디코더 (1518) 는 하나 이상의 비트스트림 파라미터들 (1502) 을 (예컨대, 수신기로부터) 수신한다. 하나 이상의 비트스트림 파라미터들 (1502) 은 인코딩된 미드 신호 파라미터들 (1526), 채널간 예측 이득 파라미터 (ICP) (1508), 및 상관 파라미터 (1509) 를 포함한다 (또는, 표시한다). ICP (1508) 는 인코더에서의 미드 신호 및 사이드 신호의 에너지 레벨들 사이의 관계를 나타낼 수도 있으며, 상관 파라미터 (1509) 는 인코더에서의 미드 신호와 사이드 신호 사이의 상관을 나타낼 수도 있다. 특정의 구현예에서, ICP (1508) 는 다음 수식에 따라서 인코더에서 결정된다:
ICP_Gain = sqrt(Energy(side_signal_unquantized)/Energy(mid_signal_unquantized))
여기서, ICP_Gain 은 ICP (1508) 이고, 인코더에서의 사이드 신호의 Energy(side_signal_unquantized) 는 사이드 에너지 레벨이고, Energy(mid_signal_unquantized) 는 인코더에서의 미드 신호의 미드 에너지 레벨이다. 상관 파라미터 (1509) 는 다음 수식에 따라서 인코더에서 결정될 수도 있다:
Figure pct00012
여기서, ICP_Gain 은 ICP (1508) 이고, |side_signal_unquantized . Mid_signal_unquantized| 는 인코더에서의 사이드 신호와 미드 신호의 내적이며, Energy(mid_signal_unquantized) 는 인코더에서의 미드 신호의 미드 에너지 레벨이다. 다른 구현예들에서, ICP (1508) 및 상관 파라미터 (1509) 는 다른 값들에 기초하여 결정될 수도 있다.
비트스트림 프로세싱 회로부 (1524) 는 하나 이상의 비트스트림 파라미터들 (1502) 을 프로세싱하여 다양한 파라미터들을 추출할 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (1524) 는 하나 이상의 비트스트림 파라미터들 (1502) 로부터 인코딩된 미드 신호 파라미터들 (1526) 을 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1524) 는 인코딩된 미드 신호 파라미터들 (1526) 을 신호 발생기 (1550) 로 (예컨대, 미드 신시사이저 (1552) 로) 제공할 수도 있다. 다른 예로서, 비트스트림 프로세싱 회로부 (1524) 는 하나 이상의 비트스트림 파라미터들 (1502) 로부터 ICP (1508) 를 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1524) 는 ICP (1508) 를 신호 발생기 (1550) 로 (예컨대, 사이드 신시사이저 (1556) 로) 제공할 수도 있다. 다른 예로서, 비트스트림 프로세싱 회로부 (1524) 는 하나 이상의 비트스트림 파라미터들 (1502) 로부터 상관 파라미터 (1509) 를 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1524) 는 상관 파라미터 (1509) 를 사이드 신호 믹서 (1590) 로 제공할 수도 있다.
미드 신시사이저 (1552) 는 인코딩된 미드 신호 파라미터들 (1526) 에 기초하여 합성된 미드 신호 (1570) 를 발생시킬 수도 있다. 사이드 신시사이저 (1556) 는 합성된 미드 신호 (1570) 및 ICP (1508) 에 기초하여 중간 합성된 사이드 신호 (1571) 를 발생시킬 수도 있다. 비한정적인 예로서, 사이드 신시사이저 (1556) 는 도 4 를 참조하여 설명된 기법들에 따라서 중간 합성된 사이드 신호 (1571) 를 발생시킬 수도 있다.
전역-통과 필터 (1530) 는 중간 합성된 사이드 신호 (1571) 를 필터링하여 필터링된 합성된 사이드 신호 (1573) 를 발생시킬 수도 있다. 전역-통과 필터 (1530) 는 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관), 잔향, 및 스테레오 확장을 수행하도록 구성될 수도 있다. 예시하기 위하여, 전역-통과 필터 (1530) 는 인코더에서 (예컨대, 송신 측에서) 추정된 스테레오 폭의 효과를 합성하기 위해 위상 조정 또는 블러링을 수행할 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1530) 는 다중 스테이지 캐스케이드된 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관) 필터들을 포함한다. 예시하기 위하여, 전역-통과 필터 (1530) 는 하나 이상의 정지된 비상관 필터들, 하나 이상의 비-정지된 비상관 필터들, 하나 이상의 비선형 전역-통과 리샘플링 필터들, 또는 이들의 조합을 포함하는 위상 분산 필터를 포함한다. 전역-통과 필터 (1530) 는 도 14 를 참조하여 설명된 바와 같이, 중간 합성된 사이드 신호 (1571) 를 필터링할 수도 있다.
일부 구현예들에서, 전역-통과 필터 (1530) 의 하나 이상의 파라미터들의 값들은 도 14 를 참조하여 설명된 바와 같이, ICP (1508) 에 기초하여 설정될 (또는, 조정될) 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1530) 의 하나 이상의 파라미터들의 값들은 상관 파라미터 (1509) 에 기초하여 설정될 (또는, 조정될) 수도 있으며, 전역-통과 필터 (1530) 의 스테이지들 중 하나 이상은 상관 파라미터 (1509), 또는 양자에 기초하여 디스에이블링될 (또는, 인에이블링될) 수도 있다. 예를 들어, 상관 파라미터 (1509) 가 상대적으로 높은 상관을 표시하면, 필터링된 합성된 사이드 신호 (1573) 및 합성된 미드 신호 (1570) 가 또한 상대적으로 높은 상관을 갖도록, 파라미터들 중 하나 이상이 감소될 수도 있거나, 스테이지들 중 하나 이상이 디스에이블링될 수도 있거나, 또는 양자일 수도 있다. 다른 예로서, 상관 파라미터 (1509) 가 상대적으로 낮은 상관을 표시하면, 필터링된 합성된 사이드 신호 (1573) 및 합성된 미드 신호 (1570) 가 또한 상대적으로 낮은 상관을 갖도록, 파라미터들 중 하나 이상이 증가될 수도 있거나, 스테이지들 중 하나 이상이 인에이블링될 수도 있거나, 또는 양자일 수도 있다. 추가적으로, 도 14 를 참조하여 설명된 바와 같이, 코딩 모드 파라미터 (또는, 다른 파라미터) 에 추가로 기초하여, 파라미터들 중 하나 이상이 설정될 (또는, 조정될) 수도 있으며, 스테이지들 중 하나 이상이 인에이블링될 (또는, 디스에이블링될) 수도 있다.
중간 합성된 사이드 신호 (1571) 및 필터링된 합성된 사이드 신호 (1573) 는 사이드 신호 믹서 (1590) 로 제공될 수도 있다. 사이드 신호 믹서 (1590) 는 상관 파라미터 (1509) 에 기초하여 중간 합성된 사이드 신호 (1571) 를 필터링된 합성된 사이드 신호 (1573) 와 믹싱하여 합성된 사이드 신호 (1572) 를 발생시킬 수도 있다. 대안적인 구현예들에서, 합성된 미드 신호 (1570) 는 전역-통과 필터링을 위해 전역-통과 필터 (1530) 로 제공되어 (ICP (1508) 의 적용 이전에) 전역-통과 필터링된 양자화된 미드 신호를 발생시킬 수도 있으며, 사이드 신호 믹서 (1590) 는 합성된 미드 신호 (1570), 전역-통과 필터링된 양자화된 미드-신호, ICP (1508), 및 상관 파라미터 (1509) 를 수신할 수도 있다. 사이드 신호 믹서 (1590) 는 ICP (1508) 및 상관 파라미터 (1509) 에 기초하여 합성된 미드 신호 (1570) 및 전역-통과 필터링된 양자화된 미드-신호를 스케일링 및 믹싱하여 합성된 사이드 신호 (1572) 를 발생시킬 수도 있다.
특정의 구현예에서, 사이드 신호 믹서 (1590) 는 다음 수식에 따라서 합성된 사이드 신호 (1572) 를 발생시킬 수도 있다:
Mapped_side(z) = ICP_Gain * [(ICP_correlation) * mid_quantized(z) + (1 - ICP_correlation) * HAP(z) *mid_quantized(z)]
여기서, Mapped_side(z) 는 합성된 사이드 신호 (1572) 이고, ICP_Gain 은 ICP (1508) 이며, ICP_correlation 은 상관 파라미터 (1509) 이고, mid_quantized(z) 는 합성된 미드 신호 (1570) 이며, HAP(z) 는 전역-통과 필터 (1530) 에 의해 적용되는 필터링이다. ICP_Gain * mid_quantized(z) 가 중간 합성된 사이드 신호 (1571) 와 동일하고 ICP_Gain * HAP(z) * mid_quantized(z) 가 필터링된 합성된 사이드 신호 (1573) 와 동일하기 때문에, 합성된 사이드 신호 (1572) 는 또한 다음 수식에 따라서 발생될 수도 있다:
합성된 사이드 신호 (1572) = 상관 파라미터 (1509) * 중간 합성된 사이드 신호 (1571) + (1 -상관 파라미터 (1509)) * 필터링된 합성된 사이드 신호 (1573)
다른 특정의 구현예에서, 사이드 신호 믹서 (1590) 는 다음 수식에 따라서 합성된 사이드 신호 (1572) 를 발생시킬 수도 있다:
Mapped_side(z) = [(ICP_correlation) * mid_quantized(z) + square_root(ICP_Gain*ICP_Gain - ICP_correlation* ICP_correlation) * HAP(z) *mid_quantized(z)]
여기서, Mapped_side(z) 는 합성된 사이드 신호 (1572) 이고, ICP_Gain 은 ICP (1508) 이며, ICP_correlation 은 상관 파라미터 (1509) 이고, mid_quantized(z) 는 합성된 미드 신호 (1570) 이며, HAP(z) 는 전역-통과 필터 (1530) 에 의해 적용되는 필터링이다. 이 수식에서, HAP(z) * mid_quantized(z) 는 ICP 적용 이전 전역-통과 필터링된 양자화된 미드 신호에 대응한다 (예컨대, 이를 나타낸다).
다른 특정의 구현예에서, 사이드 신호 믹서 (1590) 는 다음 수식에 따라서 합성된 사이드 신호 (1572) 를 발생시킬 수도 있다:
Mapped_side(z) = scale_factor1 * mid_quantized(z) + scale_factor2 * HAP(z) *mid_quantized(z).
여기서, scale_factor1 및 scale_factor2 는 다음 2개의 제약들이 만족되도록 ICP_correlation 및 ICP_Gain 에 기초하여 디코더 (1518) 에서 추정된다: 1.) Mapped_side 와 mid_quantized 사이의 교차-상관은 ICP_correlation 와 동일하며, 2.) Mapped_side 와 mid_quantized 의 에너지들의 비는 ICP_Gain^2 와 동일하다. scale_factor1 및 scale_factor2 의 값들은 다양한 분석 또는 반복 방법들 또는 다른 대안들에 의해 해답을 구할 수도 있다. 일부 구현예들에서, scale_factor1 및 scale_factor2 는 Mapped_side 를 발생시키는데 사용되기 전에 추가로 프로세싱될 수도 있다.
따라서, 믹싱되는, 필터링된 합성된 사이드 신호 (1573) 의 양 및 중간 합성된 사이드 신호 (1571) 의 양은 상관 파라미터 (1509) 에 기초할 수도 있다. 예를 들어, 필터링된 합성된 사이드 신호 (1573) 의 양은 상관 파라미터 (1509) 에서의 감소에 기초하여 증가될 수도 있다 (그리고, 중간 합성된 사이드 신호 (1571) 의 양은 감소될 수도 있다). 다른 예로서, 필터링된 합성된 사이드 신호 (1573) 의 양은 상관 파라미터 (1509) 에서의 증가에 기초하여 감소될 수도 있다 (그리고 중간 합성된 사이드 신호 (1571) 의 양은 증가될 수도 있다). 상관 파라미터 (1509) 에 기초하여 전역-통과 필터 (1530) 를 구성하는 것 및 상관 파라미터 (1509) 에 기초하여 신호들을 믹싱하는 것 양자가 설명되었지만, 다른 구현예들에서, 단지 전역-통과 필터 (1530) 를 구성하는 것 또는 신호들을 믹싱하는 것 중 하나만이 수행된다.
디코더 (1518) 는 합성된 미드 신호 (1570) 및 합성된 사이드 신호 (1572) 에 기초하여 출력 오디오 신호들을 발생시킬 수도 있다. 일부 구현예들에서, 추가적인 필터링, 업샘플링, 불연속성 감소 중 하나 이상이 도 14 를 참조하여 추가로 설명되는 바와 같이, 출력 오디오 신호들을 업믹싱하여 발생시키기 전에, 수행될 수도 있다.
따라서, 도 15 의 디코더 (1518) 는 합성된 사이드 신호와 합성된 미드 신호 사이의 상관을 인코더에서의 미드 신호와 사이드 신호 사이의 상관에 매칭하도록 구성된다. 매칭 상관은 인코더에서 수신된 입력 신호들 사이의 공간 차이들에 실질적으로 매칭하는 공간 차이들을 가지는 출력 신호들의 발생을 초래할 수도 있다.
도 16 은 도 13 의 시스템 (1300) 의 디코더 (1618) 의 제 3 예시적인 예를 예시하는 다이어그램이다. 예를 들어, 디코더 (1618) 는 도 13 의 디코더 (1318) 를 포함하거나 또는 이에 대응할 수도 있다.
디코더 (1618) 는 비트스트림 프로세싱 회로부 (1624), (미드 신시사이저 (1652) 및 사이드 신시사이저 (1656) 를 포함하는) 신호 발생기 (1650), 전역-통과 필터 (1630), 및 옵션적으로 에너지 검출기 (1660) 를 포함할 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1630) 는 제 1 지연 파라미터 및 제 1 이득 파라미터와 연관되는 제 1 스테이지, 제 2 지연 파라미터 및 제 2 이득 파라미터와 연관되는 제 2 스테이지, 제 3 지연 파라미터 및 제 3 이득 파라미터와 연관되는 제 3 스테이지, 및 제 4 지연 파라미터 및 제 4 이득 파라미터와 연관되는 제 4 스테이지를 포함할 수도 있다. 비트스트림 프로세싱 회로부 (1624), 신호 발생기 (1650), 미드 신시사이저 (1652), 사이드 신시사이저 (1656), 에너지 검출기 (1660), 및 전역-통과 필터 (1630) 는 도 14 의, 비트스트림 프로세싱 회로부 (1424), 신호 발생기 (1450), 미드 신시사이저 (1452), 사이드 신시사이저 (1456), 에너지 검출기 (1460), 및 전역-통과 필터 (1430) 를 참조하여 설명된 바와 같은 유사한 동작들을 각각 수행할 수도 있다. 디코더 (1618) 는 또한 필터/결합기 (1692) 를 포함할 수도 있다. 필터/결합기 (1692) 는 본원에서 추가로 설명되는 바와 같은, 하나 이상의 필터들, 하나 이상의 신호 결합기들, 이들의 조합, 또는 합성된 신호들을 발생시키기 위해 다수의 신호 대역들에 걸쳐서 합성된 신호들을 결합하도록 구성된 다른 회로부를 포함할 수도 있다.
동작 동안, 디코더 (1618) 는 (예컨대, 수신기로부터) 하나 이상의 비트스트림 파라미터들 (1602) 을 수신한다. 하나 이상의 비트스트림 파라미터들 (1602) 은 인코딩된 미드 신호 파라미터들 (1626), 채널간 예측 이득 파라미터 (ICP) (1608), 및 제 2 ICP (1609) 를 포함한다 (또는, 표시한다). ICP (1608) 는 인코더에서 제 1 신호 대역에서 미드 신호 및 사이드 신호의 에너지 레벨들 사이의 관계를 나타낼 수도 있으며, 제 2 ICP (1609) 는 인코더에서 제 2 신호 대역에서 미드 신호 및 사이드 신호의 에너지 레벨들 사이의 관계를 나타낼 수도 있다.
비트스트림 프로세싱 회로부 (1624) 는 하나 이상의 비트스트림 파라미터들 (1602) 을 프로세싱하여 다양한 파라미터들을 추출할 수도 있다. 예를 들어, 비트스트림 프로세싱 회로부 (1624) 는 하나 이상의 비트스트림 파라미터들 (1602) 로부터 인코딩된 미드 신호 파라미터들 (1626) 을 추출하며, 비트스트림 프로세싱 회로부 (1624) 는 인코딩된 미드 신호 파라미터들 (1626) 을 신호 발생기 (1650) 로 (예컨대, 미드 신시사이저 (1652) 로) 제공할 수도 있다. 다른 예로서, 비트스트림 프로세싱 회로부 (1624) 는 하나 이상의 비트스트림 파라미터들 (1602) 로부터 ICP (1608) 및 제 2 ICP (1609) 를 추출할 수도 있으며, 비트스트림 프로세싱 회로부 (1624) 는 ICP (1608) 및 제 2 ICP (1609) 를 신호 발생기 (1650) 로 (예컨대, 사이드 신시사이저 (1656) 로) 제공할 수도 있다.
미드 신시사이저 (1652) 는 인코딩된 미드 신호 파라미터들 (1626) 에 기초하여 합성된 미드 신호를 발생시킬 수도 있다. 신호 발생기 (1650) 는 또한 합성된 미드 신호를 다수의 대역들로 필터링하여 저-대역 합성된 미드 신호 (1670) 및 고-대역 합성된 미드 신호 (1671) 를 발생시키는 하나 이상의 필터들을 포함할 수도 있다. 사이드 신시사이저 (1656) 는 저-대역 합성된 미드 신호 (1670), 고-대역 합성된 미드 신호 (1671), ICP (1608), 및 제 2 ICP (1609) 에 기초하여 중간 합성된 사이드 신호들의 다수의 신호 대역들을 발생시킬 수도 있다. 예를 들어, 사이드 신시사이저 (1656) 는 저-대역 합성된 미드 신호 (1670) 및 ICP (1608) 에 기초하여 저-대역 중간 합성된 사이드 신호 (1672) 를 발생시킬 수도 있다. 다른 예로서, 사이드 신시사이저 (1656) 는 고-대역 합성된 미드 신호 (1671) 및 제 2 ICP (1609) 에 기초하여 고-대역 중간 합성된 사이드 신호 (1673) 를 발생시킬 수도 있다.
전역-통과 필터 (1630) 는 저-대역 중간 합성된 사이드 신호 (1672) 및 고-대역 중간 합성된 사이드 신호 (1673) 를 필터링하여 저-대역 합성된 사이드 신호 (1674) 및 고-대역 합성된 사이드 신호 (1675) 를 발생시킬 수도 있다. 예를 들어, 전역-통과 필터 (1630) 는 도 14 를 참조하여 설명된 바와 같이, 저-대역 중간 합성된 사이드 신호 (1672) 및 고-대역 합성된 사이드 신호 (1673) 를 필터링할 수도 있다. 신호들이 2개의 대역들 (예컨대, 저-대역 및 고-대역) 로 필터링되는 것으로 설명되지만, 이러한 설명은 한정하려는 것이 아니다. 다른 구현예들에서, 신호들은 상이한 대역들, 예컨대 미드-대역으로, 또는 2개보다 많은 대역들로 필터링될 수도 있다. 추가적으로, 도 14 를 참조하여 설명되는 바와 같이, 전역-통과 필터 (1630) 는 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관), 잔향, 및 스테레오 확장을 수행할 수도 있다. 예시하기 위하여, 전역-통과 필터 (1630) 는 인코더에서 (예컨대, 송신 측에서) 추정된 스테레오 폭의 효과들을 합성하기 위해 위상 조정 또는 블러링을 수행할 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1630) 는 다중 스테이지 캐스케이드된 위상 조정 (예컨대, 위상 퍼징, 위상 분산, 위상 확산, 또는 위상 비상관) 필터들을 포함한다.
일부 구현예들에서, 전역-통과 필터 (1630) 와 연관된 파라미터들의 값들, 전역-통과 필터 (1630) 의 스테이지들의 상태들 (예컨대, 인에이블링됨 또는 디스에이블링됨), 또는 양자는 저-대역 중간 합성된 사이드 신호 (1672) 및 고-대역 중간 합성된 사이드 신호 (1673) 양자를 필터링하기 위해 동일할 수도 있다. 다른 구현예들에서, 파라미터들의 값들, 스테이지들의 상태들 (예컨대, 인에이블링됨 또는 디스에이블링됨), 또는 양자는 고-대역 중간 합성된 사이드 신호 (1673) 를 필터링하는 것과 비교하여 저-대역 중간 합성된 사이드 신호 (1672) 를 필터링할 때 상이할 수도 있다. 예를 들어, 파라미터들은 저-대역 중간 합성된 사이드 신호 (1672) 를 필터링한 후 값들의 제 1 세트로 설정될 수도 있다. 저-대역 중간 합성된 사이드 신호 (1672) 가 필터링된 후, 파라미터들의 값들 중 하나 이상은 조정될 수도 있으며, 고-대역 중간 합성된 사이드 신호 (1673) 는 조정된 파라미터 값들에 기초하여 필터링될 수도 있다. 다른 예로서, 저-대역 중간 합성된 사이드 신호 (1672) 를 필터링하도록 인에이블링되는 전역-통과 필터 (1630) 의 스테이지들의 개수는 고-대역 중간 합성된 사이드 신호 (1673) 를 필터링하기 위해 인에이블링되는 스테이지들의 개수와는 상이할 수도 있다. 일부 구현예들에서, 전역-통과 필터 (1630) 는 도 15 를 참조하여 설명된 바와 같이, 신호 대역들의 각각에 대응하는 상관 파라미터들에 기초하여 추가적으로 구성될 수도 있다. 따라서, 적용되는 비상관의 양은 상이한 신호 대역들에서 상이할 수도 있다.
저-대역 합성된 미드 신호 (1670), 고-대역 합성된 미드 신호 (1671), 저-대역 합성된 사이드 신호 (1674), 및 고-대역 합성된 사이드 신호 (1675) 는 필터/결합기 (1692) 로 제공될 수도 있다. 필터/결합기 (1692) 는 다수의 신호 대역들을 결합하여 합성된 신호들을 발생시킬 수도 있다. 예를 들어, 필터/결합기 (1692) 는 저-대역 합성된 미드 신호 (1670) 와 고-대역 합성된 미드 신호 (1671) 를 결합하여 합성된 미드 신호 (1676) 를 발생시킬 수도 있다. 다른 예로서, 필터/결합기 (1692) 는 저-대역 합성된 사이드 신호 (1674) 와 고-대역 합성된 사이드 신호 (1675) 를 결합하여 합성된 사이드 신호 (1677) 를 발생시킬 수도 있다.
디코더 (1618) 는 합성된 미드 신호 (1676) 및 합성된 사이드 신호 (1677) 에 기초하여 출력 오디오 신호들을 발생시킬 수도 있다. 일부 구현예들에서, 추가적인 필터링, 업샘플링, 및 불연속성 감소 중 하나 이상이 도 14 를 참조하여 추가로 설명되는 바와 같이, 출력 오디오 신호들을 업믹싱하여 발생시키기 전에 수행될 수도 있다.
도 16 의 디코더 (1618) 는 상이한 대역들에 대한 다수의 채널간 예측 이득 파라미터들 (예컨대, ICP (1608) 및 제 2 ICP (1609)) 을 이용한 합성된 미드 신호 (1676) 로부터의 합성된 사이드 신호 (1677) 의 예측 (예컨대, 맵핑) 을 가능하게 한다. 추가적으로, 디코더 (1618) 는 상이한 대역들에서의 상이한 양들에 대해 합성된 미드 신호 (1676) 와 합성된 사이드 신호 (1677) 사이의 상관을 감소시키고 (예컨대, 비상관을 증가시키고), 이는 상이한 주파수들에 걸쳐서 다양한 공간 다이버시티를 가지는 출력 오디오 신호들의 발생.
도 17 은 오디오 신호들을 인코딩하는 특정의 방법 (1700) 을 예시하는 플로우 차트이다. 특정의 구현예에서, 방법 (1700) 은 도 2 의 제 1 디바이스 (204) 또는 도 3 의 인코더 (314) 에서 수행될 수도 있다.
방법 (1700) 은 1702 에서, 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 제 1 디바이스는 도 2 의 제 1 디바이스 (204) 또는 도 3 의 인코더 (314) 를 포함하는 디바이스를 포함하거나 또는 이에 대응할 수도 있으며, 미드 신호는 도 2 의 미드 신호 (211) 또는 도 3 의 미드 신호 (311) 를 포함하거나 또는 이에 대응할 수도 있으며, 제 1 오디오 신호는 도 2 의 제 1 오디오 신호 (230) 또는 도 3 의 제 1 오디오 신호 (330) 를 포함하거나 또는 이에 대응할 수도 있으며, 제 2 오디오 신호는 도 2 의 제 2 오디오 신호 (232) 또는 도 3 의 제 2 오디오 신호 (332) 를 포함하거나 또는 이에 대응할 수도 있다. 특정의 구현예에서, 제 1 디바이스는 또한 모바일 디바이스를 포함하거나 또는 이에 대응한다. 다른 특정의 구현예에서, 제 1 디바이스는 또한 기지국을 포함하거나 또는 이에 대응한다.
방법 (1700) 은 1704 에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 사이드 신호는 도 2 의 사이드 신호 (213) 또는 도 3 의 사이드 신호 (313) 를 포함하거나 또는 이에 대응할 수도 있다.
방법 (1700) 은 1706 에서, 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 단계를 포함한다. 예를 들어, 채널간 예측 이득 파라미터는 도 2 의 ICP (208) 또는 도 3 의 ICP (308) 를 포함하거나 또는 이에 대응할 수도 있다.
방법 (1700) 은 1708 에서, 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 단계를 더 포함한다. 예를 들어, 도 2 를 참조하여 설명된 바와 같이, ICP (208) 는 (인코딩된 미드 신호를 표시하는) 하나 이상의 비트스트림 파라미터들 (202) 에 포함될 수도 있으며 제 2 디바이스 (206) 로 전송될 수도 있다.
특정의 구현예에서, 방법 (1700) 은 제 1 오디오 신호를 다운샘플링하여 제 1 다운샘플링된 오디오 신호를 발생시키는 단계, 및 제 2 오디오 신호를 다운샘플링하여 제 2 다운샘플링된 오디오 신호를 발생시키는 단계를 더 포함한다. 채널간 예측 이득 파라미터는 제 1 다운샘플링된 오디오 신호 및 제 2 다운샘플링된 오디오 신호에 기초할 수도 있다. 예를 들어, 다운샘플러 (340) 는 도 3 을 참조하여 설명된 바와 같이, ICP 발생기 (320) 에 의한 ICP (308) 의 발생 이전에 미드 신호 (311) 및 사이드 신호 (313) 를 다운샘플링할 수도 있다. 대안적인 구현예에서, 채널간 예측 이득 파라미터는 제 1 오디오 신호 및 제 2 오디오 신호와 연관된 입력 샘플링 레이트에서 결정된다. 예를 들어, 일부 구현예들에서, 도 3 을 참조하여 추가로 설명되는 바와 같이, 다운샘플러 (340) 는 인코더 (314) 에 포함되지 않으며, ICP (308) 는 입력 샘플링 레이트에서 발생된다.
다른 특정의 구현예에서, 방법 (1700) 은 채널간 예측 이득 파라미터를 제 2 디바이스로 전송하기 전에 채널간 예측 이득 파라미터에 대해 평활화 동작을 수행하는 단계를 더 포함한다. 예를 들어, ICP 평활기 (350) 는 평활화 인자 (352) 에 기초하여 ICP (308) 를 평활화할 수도 있다. 특정의 구현예에서, 평활화 동작은 고정된 평활화 인자에 기초한다. 대안적인 구현예에서, 평활화 동작은 적응적 평활화 인자에 기초한다. 적응적 평활화 인자는 미드 신호의 신호 에너지에 기초할 수도 있다. 예를 들어, 평활화 인자 (352) 는 도 3 을 참조하여 설명된 바와 같이, 장기 신호 에너지 및 단기 신호 에너지에 기초할 수도 있다. 대안적으로, 적응적 평활화 인자는 미드 신호와 연관된 보이싱 파라미터에 기초할 수도 있다. 예를 들어, 평활화 인자 (352) 는 도 3 을 참조하여 설명된 바와 같이, 보이싱 파라미터에 기초할 수도 있다.
다른 특정의 구현예에서, 방법 (1700) 은 미드 신호를 프로세싱하여 저-대역 미드 신호 및 고-대역 미드 신호를 발생시키고 사이드 신호를 프로세싱하여 저-대역 사이드 신호 및 고-대역 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 3 을 참조하여 설명된 바와 같이, 하나 이상의 필터들 (331) 은 미드 신호 (311) 를 프로세싱하여 저-대역 미드 신호 (333) 및 고-대역 미드 신호 (334) 를 발생시킬 수도 있으며, 하나 이상의 필터들 (331) 은 사이드 신호 (313) 를 프로세싱하여 저-대역 사이드 신호 (336) 및 고-대역 사이드 신호 (338) 를 발생시킬 수도 있다. 방법 (1700) 은 저-대역 미드 신호 및 저-대역 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 단계 및 고-대역 미드 신호 및 고-대역 사이드 신호에 기초하여 제 2 채널간 예측 이득 파라미터를 발생시키는 단계를 포함한다. 예를 들어, 도 3 을 참조하여 설명된 바와 같이, ICP 발생기 (320) 는 저-대역 미드 신호 (333) 및 저-대역 사이드 신호 (336) 에 기초하여 ICP (308) 를 발생시킬 수도 있으며, ICP 발생기 (320) 는 고-대역 미드 신호 (334) 및 고-대역 사이드 신호 (338) 에 기초하여 제 2 ICP (354) 를 발생시킬 수도 있다. 방법 (1700) 은 제 2 채널간 예측 이득 파라미터를 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호와 함께 제 2 디바이스로 전송하는 단계를 더 포함한다. 예를 들어, ICP (308) 및 제 2 ICP (354) 는 도 3 을 참조하여 설명된 바와 같이, 인코더 (314) 에 의해 출력되는 하나 이상의 비트스트림 파라미터들 (302) 에 포함될 (또는, 이에 의해 표시될) 수도 있다.
특정의 구현예에서, 방법 (1700) 은 미드 신호 및 사이드 신호에 기초하여 상관 파라미터를 발생시키는 단계 및 상관 파라미터를 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호와 함께 제 2 디바이스로 전송하는 단계를 더 포함한다. 예를 들어, 상관 파라미터는 도 15 의 상관 파라미터 (1509) 를 포함하거나 또는 이에 대응할 수도 있다. 채널간 예측 이득 파라미터는 사이드 신호의 에너지 레벨과 미드 신호의 에너지 레벨의 비에 기초할 수도 있으며, 상관 파라미터는 미드 신호의 에너지 레벨과, 미드 신호와 사이드 신호의 내적의 비에 기초할 수도 있다. 예를 들어, 상관 파라미터는 도 15 를 참조하여 설명된 바와 같이 결정될 수도 있다.
따라서, 방법 (1700) 은 디코더에서 사이드 신호를 예측한다는 결정과 연관되는 오디오 신호의 프레임들에 대한 채널간 예측 이득 파라미터 발생을 가능하게 한다. 채널간 예측 이득 파라미터를 전송하는 것은 인코딩된 사이드 신호의 프레임을 전송하는 것과 비교하여 네트워크 리소스들을 절약할 수도 있다. 대안적으로, 인코딩된 사이드 신호를 전송하는데 달리 사용될 하나 이상의 비트들은 인코딩된 미드 신호의 추가적인 비트들을 전송하도록 대신 용도 변경될 (예컨대, 사용될) 수도 있으며, 이는 디코더에서의 합성된 미드 신호 및 예측된 사이드 신호의 품질을 향상시킬 수도 있다.
도 18 은 오디오 신호들을 디코딩하는 특정의 방법 (1800) 을 예시하는 플로우 차트이다. 특정의 구현예에서, 방법 (1800) 은 도 2 의 제 2 디바이스 (206) 또는 도 4 의 디코더 (418) 에서 수행될 수도 있다.
방법 (1800) 은 1802 에서, 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 단계를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함할 수도 있다. 예를 들어, 제 1 디바이스는 도 2 의 제 2 디바이스 (206) 또는 도 4 의 디코더 (418) 를 포함하는 디바이스를 포함하거나 또는 이에 대응할 수도 있으며, 채널간 예측 이득 파라미터는 도 2 의 ICP (208) 또는 도 4 의 ICP (408) 를 포함하거나 또는 이에 대응할 수도 있으며, 인코딩된 오디오 신호는 도 2 의 하나 이상의 비트스트림 파라미터들 (202) 또는 도 4 의 하나 이상의 비트스트림 파라미터들 (402) 에 의해 표시될 수도 있다. 특정의 구현예에서, 인코딩된 오디오 신호는 도 2 의 인코딩된 미드 신호 (225) 를 포함하거나 또는 이에 대응한다.
방법 (1800) 은 1804 에서, 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 합성된 미드 신호는 도 2 의 합성된 미드 신호 (252) 또는 도 4 의 합성된 미드 신호 (470) 를 포함하거나 또는 이에 대응할 수도 있다.
방법 (1800) 은 1806 에서, 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 합성된 사이드 신호를 발생시키는 단계를 더 포함한다. 예를 들어, 합성된 사이드 신호는 도 2 의 합성된 사이드 신호 (254) 또는 도 4 의 합성된 사이드 신호 (472) 를 포함하거나 또는 이에 대응할 수도 있다.
특정의 구현예에서, 방법 (1800) 은 합성된 사이드 신호를 발생시키기 전에, 고정된 필터를 합성된 미드 신호에 적용하는 단계를 더 포함한다. 예를 들어, 하나 이상의 필터들 (454) 은 도 4 를 참조하여 설명된 바와 같이, 합성된 사이드 신호 (472) 의 발생 전에 합성된 미드 신호 (470) 에 적용되는 고정된 필터를 포함할 수도 있다. 다른 특정의 구현예에서, 방법 (1800) 은 고정된 필터를 합성된 사이드 신호에 적용하는 단계를 더 포함한다. 예를 들어, 하나 이상의 필터들 (458) 은 도 4 를 참조하여 설명된 바와 같이, 합성된 사이드 신호 (472) 에 적용되는 고정된 필터를 포함할 수도 있다. 다른 특정의 구현예에서, 방법 (1800) 은 합성된 사이드 신호를 발생시키기 전에, 적응 필터를 합성된 미드 신호에 적용하는 단계를 포함한다. 적응 필터와 연관된 적응 필터 계수들은 제 2 디바이스로부터 수신될 수도 있다. 예를 들어, 하나 이상의 필터들 (454) 은 도 4 를 참조하여 설명된 바와 같이, 합성된 사이드 신호 (472) 의 발생 전에 하나 이상의 계수들 (406) 에 기초하여 합성된 미드 신호 (470) 에 적용되는 적응 필터를 포함할 수도 있다. 다른 특정의 구현예에서, 방법 (1800) 은 적응 필터를 합성된 사이드 신호에 적용하는 단계를 포함한다. 적응 필터와 연관된 적응 필터 계수들은 제 2 디바이스로부터 수신될 수도 있다. 예를 들어, 하나 이상의 필터들 (458) 은 도 4 를 참조하여 설명된 바와 같이, 하나 이상의 계수들 (406) 에 기초하여 합성된 사이드 신호 (472) 에 적용되는 적응 필터를 포함할 수도 있다.
다른 특정의 구현예에서, 방법 (1800) 은 제 2 디바이스로부터 제 2 채널간 예측 이득 파라미터를 수신하고, 합성된 미드 신호를 프로세싱하여 저-대역 합성된 미드 신호를 발생시키고, 그리고 합성된 미드 신호를 프로세싱하여 고-대역 합성된 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 하나 이상의 필터들 (454) 은 합성된 미드 신호 (470) 를 프로세싱하여 저-대역 합성된 미드 신호 (474) 및 고-대역 합성된 미드 신호 (473) 를 발생시킬 수도 있다. 합성된 사이드 신호를 발생시키는 것은 저-대역 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 저-대역 합성된 사이드 신호를 발생시키는 것, 고-대역 합성된 미드 신호 및 제 2 채널간 예측 이득 파라미터에 기초하여 고-대역 합성된 사이드 신호를 발생시키는 것, 및 저-대역 합성된 사이드 신호 및 고-대역 합성된 사이드 신호를 프로세싱하여 합성된 사이드 신호를 발생시키는 것을 포함한다. 예를 들어, 사이드 신시사이저 (456) 는 저-대역 합성된 미드 신호 (474) 및 ICP (408) 에 기초하여 저-대역 합성된 사이드 신호 (476) 를 발생시킬 수도 있으며, 사이드 신시사이저 (456) 는 고-대역 합성된 미드 신호 (473) 및 제 2 ICP 에 기초하여 고-대역 합성된 사이드 신호 (475) 를 발생시킬 수도 있다. 하나 이상의 필터들 (458) 은 도 4 를 참조하여 설명된 바와 같이, 저-대역 합성된 사이드 신호 (476) 및 고-대역 합성된 사이드 신호 (475) 를 프로세싱하여 합성된 사이드 신호 (472) 를 발생시킬 수도 있다.
따라서, 방법 (1800) 은 인코딩된 미드 신호 (또는, 이를 표시하는 파라미터들) 및 채널간 예측 이득 파라미터를 이용한 디코더에서의 합성된 사이드 신호의 예측 (예컨대, 맵핑) 을 가능하게 한다. 채널간 예측 이득 파라미터를 수신하는 것은 인코더로부터 인코딩된 사이드 신호의 프레임을 수신하는 것과 비교하여 네트워크 리소스들을 절약할 수도 있다. 대안적으로, 인코딩된 사이드 신호를 디코더로 전송하는데 달리 사용될 수신된 하나 이상의 비트들은 인코딩된 미드 신호의 추가적인 비트들을 디코더로 전송하도록 대신 용도 변경될 (예컨대, 사용될) 수도 있으며, 이는 디코더에서의 합성된 미드 신호 및 합성된 사이드 신호의 품질을 향상시킬 수도 있다.
도 19 를 참조하면, 동작의 방법이 도시되며, 일반적으로 1900 으로 지정된다. 방법 (1900) 은 도 1 의, 미드사이드 발생기 (148), 채널간 정렬기 (108), 신호 발생기 (116), 송신기 (110), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 도 2 의, 신호 발생기 (216), 송신기 (210), 인코더 (214), 제 1 디바이스 (204), 또는 시스템 (200) 중 적어도 하나에 의해 수행될 수도 있다.
방법 (1900) 은 1902 에서, 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 미드사이드 발생기 (148) 는 도 1 및 도 8 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여 미드 신호 (111) 를 발생시킬 수도 있다.
방법 (1900) 은 또한 1904 에서, 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 미드사이드 발생기 (148) 는 도 1 및 도 8 을 참조하여 설명된 바와 같이 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여 사이드 신호 (113) 를 발생시킬 수도 있다.
방법 (1900) 은 1906 에서, 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 단계를 더 포함한다. 예를 들어, 도 1 의 채널간 정렬기 (108) 는 도 1 및 도 7 을 참조하여 설명된 바와 같이 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자에 기초하여 ICA 파라미터들 (107) 을 결정할 수도 있다.
방법 (1900) 은 또한 1908 에서, 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 단계를 포함한다. 예를 들어, 도 1 의 CP 선택기 (122) 는 도 1 및 도 9 를 참조하여 설명된 바와 같이 ICA 파라미터들 (107) 에 기초하여 CP 파라미터 (109) 를 결정할 수도 있다. CP 파라미터 (109) 는 사이드 신호 (113) 가 송신을 위해 인코딩되어야 하는지 여부를 표시할 수도 있다.
방법 (1900) 은 1910 에서, 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 더 포함한다. 예를 들어, 도 1 의 신호 발생기 (116) 는 도 1 을 참조하여 설명된 바와 같이, 미드 신호 (111) 에 대응하는 인코딩된 미드 신호 (121) 를 발생시킬 수도 있다.
방법 (1900) 은 또한 1912 에서, 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (116) 는 사이드 신호 (113) 가 송신을 위해 인코딩되어야 하는 것으로 CP 파라미터 (109) 가 표시한다고 결정하는 것에 응답하여, 인코딩된 사이드 신호 (123) 를 발생시킬 수도 있다.
방법 (1900) 은 1914 에서, 디바이스로부터, 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들을 송신하는 단계를 더 포함한다. 예를 들어, 도 1 의 송신기 (110) 는 인코딩된 미드 신호 (121), 인코딩된 사이드 신호 (123), 또는 양자에 대응하는 비트스트림 파라미터들 (102) 을 송신할 수도 있다.
방법 (1900) 은 따라서 ICA 파라미터들 (107) 에 기초하여, 인코딩된 사이드 신호 (123) 가 송신되어야 하는지 여부를 동적으로 결정하는 것을 가능하게 한다. CP 선택기 (122) 는 예측된 합성된 신호가 사이드 신호 (113) 에 가깝게 근접할 가능성이 있다는 것을 ICA 파라미터들 (107) 이 표시할 때 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다고 결정할 수도 있다. 인코더 (114) 는 따라서, 예측된 합성된 신호가 대응하는 출력 신호들에 대해 거의 또는 전혀 없는 인지가능한 영향을 미칠 가능성이 있을 때 인코딩된 사이드 신호 (123) 를 송신하는 것을 억제함으로써 네트워크 리소스들을 절약할 수도 있다.
도 20 을 참조하면, 동작의 방법이 도시되며, 일반적으로 2000 으로 지정된다. 방법 (2000) 은 도 1 의, 수신기 (160), CP 결정기 (172), 업믹스 파라미터 발생기 (176), 신호 발생기 (174), 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 도 2 의, 신호 발생기 (274), 디코더 (218), 또는 제 2 디바이스 (206) 중 적어도 하나에 의해 수행될 수도 있다.
방법 (2000) 은 2002 에서, 디바이스에서, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 단계를 포함한다. 예를 들어, 도 1 의 수신기 (160) 는 적어도 인코딩된 미드 신호 (121) 에 대응하는 비트스트림 파라미터들 (102) 을 수신할 수도 있다.
방법 (2000) 은 또한 2004 에서, 디바이스에서, 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (174) 는 도 1 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 에 기초하여 합성된 미드 신호 (171) 를 발생시킬 수도 있다.
방법 (2000) 은 2006 에서, 디바이스에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 단계를 더 포함한다. 예를 들어, 도 1 의 CP 결정기 (172) 는 도 1 및 도 10 을 참조하여 추가로 설명된 바와 같이, CP 파라미터 (179) 를 발생시킬 수도 있다. CP 파라미터 (179) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하는지 여부를 표시할 수도 있다.
방법 (2000) 은 2006 에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 2008 에서, 비트스트림 파라미터들에 기초하여 합성된 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (174) 는 도 1 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응한다고 결정하는 것에 응답하여, 비트스트림 파라미터들 (102) 에 기초하여 합성된 사이드 신호 (173) 를 발생시킬 수도 있다.
방법 (2000) 은 2006 에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하지 않는다고 결정하는 것에 응답하여, 2010 에서, 합성된 미드 신호에 적어도 부분적으로 기초하여 합성된 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (174) 는 도 1 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다고 결정하는 것에 응답하여, 합성된 미드 신호 (171) 에 적어도 부분적으로 기초하여, 합성된 사이드 신호 (173) 를 발생시킬 수도 있다. 방법 (2000) 은 따라서, 디코더 (118) 가 합성된 미드 신호 (171) 에 기초하여 합성된 사이드 신호 (173) 를 동적으로 예측할 수 있게 하거나 또는 비트스트림 파라미터들 (102) 에 기초하여 합성된 사이드 신호 (173) 를 디코딩할 수 있게 한다.
도 21 을 참조하면, 동작의 방법이 도시되며 일반적으로 2100 으로 지정된다. 방법 (2100) 은 도 1 의, 미드사이드 발생기 (148), 채널간 정렬기 (108), 신호 발생기 (116), 송신기 (110), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 도 2 의, 신호 발생기 (216), 송신기 (210), 인코더 (214), 제 1 디바이스 (204), 또는 시스템 (200) 중 적어도 하나에 의해 수행될 수도 있다.
방법 (2100) 은 2102 에서, 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 한다는 것을 예측 또는 코딩 파라미터가 표시한다고 결정하는 것에 응답하여, 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 예를 들어, 도 8 의 다운믹스 파라미터 발생기 (802) 는 도 8 을 참조하여 설명된 바와 같이, 사이드 신호 (113) 가 송신을 위해 인코딩되어야 한다고 CP 파라미터 (809) 가 표시한다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) (예컨대, 제 1 값) 을 갖는 다운믹스 파라미터 (803) 를 발생시킬 수도 있다. 다운믹스 파라미터 값 (807) 은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초할 수도 있다. 에너지 메트릭, 상관 메트릭, 또는 양자는 참조 신호 (103) 및 조정된 목표 신호 (105) 에 기초할 수도 있다.
방법 (2100) 은 또한 2104 에서, 디바이스에서, 사이드 신호가 송신을 위해 인코딩되지 않아야 한다는 것을 예측 또는 코딩 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여, 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 예를 들어, 도 8 의 다운믹스 파라미터 발생기 (802) 는 도 8 을 참조하여 설명된 바와 같이, 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다는 것을 CP 파라미터 (809) 가 표시한다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (805) (예컨대, 제 2 값) 을 갖는 다운믹스 파라미터 (803) 을 발생시킬 수도 있다. 다운믹스 파라미터 값 (805) 은 도 8 을 참조하여 설명된 바와 같이, 디폴트 다운믹스 파라미터 값 (예컨대, 0.5), 다운믹스 파라미터 값 (807), 또는 양자에 기초할 수도 있다.
방법 (2100) 은 2106 에서, 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 단계를 더 포함한다. 예를 들어, 도 1 의 미드사이드 발생기 (148) 는 도 1 및 도 8 을 참조하여 설명된 바와 같이 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 및 다운믹스 파라미터 (115) 에 기초하여, 미드 신호 (111) 를 발생시킬 수도 있다.
방법 (2100) 은 또한 2108 에서, 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (116) 는 도 1 을 참조하여 설명된 바와 같이, 미드 신호 (111) 에 대응하는 인코딩된 미드 신호 (121) 를 발생시킬 수도 있다.
방법 (2100) 은 2110 에서, 디바이스로부터, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 송신하는 단계를 더 포함한다. 예를 들어, 도 1 의 송신기 (110) 는 적어도 인코딩된 미드 신호 (121) 에 대응하는 비트스트림 파라미터들 (102) 을 송신할 수도 있다.
방법 (2100) 은 따라서, 사이드 신호 (113) 가 송신을 위해 인코딩되어야 하는지 여부에 기초하여, 다운믹스 파라미터 (115) 를 다운믹스 파라미터 값 (805) 또는 다운믹스 파라미터 값 (807) 으로 동적으로 설정할 수 있게 한다. 다운믹스 파라미터 값 (805) 은 사이드 신호 (113) 의 에너지를 감소시킬 수도 있다. 예측된 합성된 사이드 신호는 감소된 에너지로 사이드 신호 (113) 에 더 가깝게 근접할 수도 있다.
도 22 를 참조하면, 동작의 방법이 도시되며, 일반적으로 2200 으로 지정된다. 방법 (2200) 은 도 1 의, 수신기 (160), CP 결정기 (172), 업믹스 파라미터 발생기 (176), 신호 발생기 (174), 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 도 2 의, 신호 발생기 (274), 디코더 (218), 또는 제 2 디바이스 (206) 중 적어도 하나에 의해 수행될 수도 있다.
방법 (2200) 은 2202 에서, 디바이스에서, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 단계를 포함한다. 예를 들어, 도 1 의 수신기 (160) 는 적어도 인코딩된 미드 신호 (121) 에 대응하는 비트스트림 파라미터들 (102) 을 수신할 수도 있다.
방법 (2200) 은 또한 2204 에서, 디바이스에서, 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (174) 는 도 1 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 에 기초하여 합성된 미드 신호 (171) 를 발생시킬 수도 있다.
방법 (2200) 은 2206 에서, 디바이스에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 단계를 더 포함한다. 예를 들어, 도 1 의 CP 결정기 (172) 는 도 1 및 도 10 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하는지 여부를 표시하는 CP 파라미터 (179) 를 발생시킬 수도 있다.
방법 (2200) 은 또한 2208 에서, 디바이스에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 제 1 값을 가지는 업믹스 파라미터를 발생시키는 단계를 포함한다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 도 1 및 도 11 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응한다는 것을 CP 파라미터 (179) 가 표시한다고 결정하는 것에 응답하여, 다운믹스 파라미터 값 (807) (예컨대, 제 1 값) 을 가지는 업믹스 파라미터 (175) 를 발생시킬 수도 있다. 다운믹스 파라미터 값 (807) 은 도 1 및 도 11 을 참조하여 설명된 바와 같이 제 1 디바이스 (104) 로부터 수신된 다운믹스 파라미터 (115) 에 기초할 수도 있다.
방법 (2200) 은 2210 에서, 디바이스에서, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하지 않는다고 결정하는 것에 적어도 부분적으로 기초하여, 제 2 값을 갖는 업믹스 파라미터를 발생시키는 단계를 더 포함한다. 예를 들어, 업믹스 파라미터 발생기 (176) 는 도 1 및 도 11 을 참조하여 설명된 바와 같이, 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다는 것을 CP 파라미터 (179) 가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여, 다운믹스 파라미터 값 (805) (예컨대, 제 2 값) 을 가지는 업믹스 파라미터 (175) 를 발생시킬 수도 있다. 다운믹스 파라미터 값 (805) 은 도 8 및 도 11 을 참조하여 설명된 바와 같이 디폴트 파라미터 값 (예컨대, 0.5) 에 적어도 부분적으로 기초할 수도 있다.
방법 (2200) 은 또한 2212 에서, 디바이스에서, 적어도 합성된 미드 신호 및 업믹스 파라미터에 기초하여 출력 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 신호 발생기 (174) 는 도 1 을 참조하여 설명된 바와 같이, 적어도 합성된 미드 신호 (171) 및 업믹스 파라미터 (175) 에 기초하여, 제 1 출력 신호 (126), 제 2 출력 신호 (128), 또는 양자를 발생시킬 수도 있다.
방법 (2200) 은 따라서, 디코더 (118) 가 CP 파라미터 (179) 에 기초하여 업믹스 파라미터 (175) 를 결정할 수 있게 한다. 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다는 것을 CP 파라미터 (179) 가 표시할 때, 디코더 (118) 는 인코더 (114) 로부터 다운믹스 파라미터 (115) 를 수신하는 것과는 독립적으로, 업믹스 파라미터 (175) 를 결정할 수 있다. 네트워크 리소스들 (예컨대, 대역폭) 은 다운믹스 파라미터 (115) 가 송신되지 않을 때 절약될 수도 있다. 특정의 구현예에서, 다운믹스 파라미터 (115) 를 송신하는데 송신될 비트들이 비트스트림 파라미터들 (102) 또는 다른 파라미터들을 나타내도록 용도 변경될 수도 있다. 용도 변경된 비트들에 기초한 출력 신호들은 더 나은 오디오 품질을 가질 수도 있으며, 예컨대, 출력 신호들은 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자에 더 가깝게 근접할 수도 있다.
도 23 은 오디오 신호들을 디코딩하는 특정의 방법을 예시하는 플로우 차트이다. 특정의 구현예에서, 방법 (2300) 은 도 13 의 제 2 디바이스 (1306), 도 14 의 디코더 (1418), 도 15 의 디코더 (1518), 또는 도 16 의 디코더 (1618) 에서 수행될 수도 있다.
방법 (2300) 은 2302 에서, 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 단계를 포함할 수도 있다. 예를 들어, 채널간 예측 이득 파라미터는 도 13 의 ICP (1308), 도 14 의 ICP (1408), 도 15 의 ICP (1508), 또는 도 16 의 ICP (1608) 를 포함하거나 또는 이에 대응할 수도 있으며, 인코딩된 오디오 신호는 도 13 의 하나 이상의 비트스트림 파라미터들 (1302), 도 14 의 하나 이상의 비트스트림 파라미터들 (1402), 도 15 의 하나 이상의 비트스트림 파라미터들 (1502), 또는 도 16 의 하나 이상의 비트스트림 파라미터들 (1602) 을 포함하거나 또는 이에 대응할 수도 있으며, 제 1 디바이스는 도 13 의 제 1 디바이스 (1304) 를 포함하거나 또는 이에 대응할 수도 있으며, 제 2 디바이스는 도 13 의 제 2 디바이스 (1306), 도 14 의 디코더 (1418) 를 포함하는 디바이스, 도 15 의 디코더 (1518) 를 포함하는 디바이스, 또는 도 16 의 디코더 (1618) 를 포함하는 디바이스를 포함하거나 또는 이에 대응할 수도 있다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함할 수도 있다.
방법 (2300) 은 2304 에서, 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 단계를 포함할 수도 있다. 예를 들어, 합성된 미드 신호는 도 13 의 합성된 미드 신호 (1352), 도 14 의 합성된 미드 신호 (1470), 도 15 의 합성된 미드 신호 (1570), 또는 도 16 의 합성된 미드 신호 (1676) 를 포함하거나 또는 이에 대응할 수도 있다.
방법 (2300) 은 2306 에서, 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 단계를 포함할 수도 있다. 예를 들어, 중간 합성된 사이드 신호는 도 13 의 중간 합성된 사이드 신호 (1354), 도 14 의 중간 합성된 사이드 신호 (1471), 또는 도 15 의 중간 합성된 사이드 신호 (1571) 를 포함하거나 또는 이에 대응할 수도 있다.
방법 (2300) 은 2308 에서, 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 단계를 더 포함할 수도 있다. 예를 들어, 합성된 사이드 신호는 도 13 의 합성된 사이드 신호 (1355), 도 14 의 합성된 사이드 신호 (1472), 도 15 의 합성된 사이드 신호 (1572), 또는 도 16 의 합성된 사이드 신호 (1677) 를 포함하거나 또는 이에 대응할 수도 있다.
특정의 구현예에서, 필터링은 전역-통과 필터, 예컨대 도 13 의 필터 (1375), 도 14 의 전역-통과 필터 (1430), 도 15 의 전역-통과 필터 (1530), 또는 도 16 의 전역-통과 필터 (1630) 에 의해 수행될 수도 있다. 방법 (2300) 은 채널간 예측 이득 파라미터에 기초하여 전역-통과 필터의 적어도 하나의 파라미터의 값을 설정하는 단계를 더 포함할 수도 있다. 예를 들어, 전역-통과 필터 (1430) 와 연관된 파라미터들 중 하나 이상의 값들은 도 14 를 참조하여 설명된 바와 같이, ICP (1408) 에 기초하여 설정될 수도 있다. 적어도 하나의 파라미터는 지연 파라미터, 이득 파라미터, 또는 양자를 포함할 수도 있다.
특정의 구현예에서, 전역-통과 필터는 다수의 스테이지들을 포함한다. 예를 들어, 전역-통과 필터는 도 14 내지 도 16 을 참조하여 설명된 바와 같이 다수의 스테이지들을 포함할 수도 있다. 방법 (2300) 은 제 2 디바이스로부터 제 1 디바이스에서 코딩 모드 파라미터를 수신하는 단계 및 음악 코딩 모드를 표시하는 코딩 모드 파라미터에 기초하여 전역-통과 필터의 다수의 스테이지들의 각각을 인에이블링시키는 단계를 포함할 수도 있다. 예를 들어, 다수의 스테이지들의 각각은 도 14 를 참조하여 설명된 바와 같이, 음악 코딩 모드를 표시하는 코딩 모드 파라미터 (1407) 에 기초하여, 인에이블링될 수도 있다. 방법 (2300) 은 음성 코딩 모드를 표시하는 코딩 모드 파라미터에 기초하여 전역-통과 필터의 적어도 하나의 스테이지를 디스에이블링시키는 단계를 더 포함할 수도 있다. 예를 들어, 다수의 스테이지들 중 하나 이상은 도 14 를 참조하여 설명된 바와 같이, 음성 코딩 모드를 표시하는 코딩 모드 파라미터 (1407) 에 기초하여 디스에이블링될 수도 있다.
다른 특정의 구현예에서, 방법 (2300) 은 제 2 디바이스로부터 제 1 디바이스에서 제 2 채널간 예측 이득 파라미터를 수신하는 단계 및 합성된 미드 신호를 프로세싱하여 저-대역 합성된 미드 신호 및 고-대역 합성된 미드 신호를 발생시키는 단계를 포함할 수도 있다. 예를 들어, 도 16 을 참조하여 설명된 바와 같이, 제 2 ICP (1609) 및 ICP (1608) 는 디코더 (1618) 에서 수신될 수도 있으며, 합성된 미드 신호가 프로세싱되어 저-대역 합성된 미드 신호 (1670) 및 고-대역 합성된 미드 신호 (1671) 를 발생시킬 수도 있다. 중간 합성된 사이드 신호를 발생시키는 것은 저-대역 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 저-대역 중간 합성된 사이드 신호를 발생시키는 것 및 고-대역 합성된 미드 신호 및 제 2 채널간 예측 이득 파라미터에 기초하여 고-대역 중간 합성된 사이드 신호를 발생시키는 것을 포함할 수도 있다. 예를 들어, 저-대역 중간 합성된 사이드 신호 (1672) 는 저-대역 합성된 미드 신호 (1670) 및 ICP (1608) 에 기초하여 발생될 수도 있으며, 고-대역 중간 합성된 사이드 신호 (1673) 는 고-대역 합성된 미드 신호 (1671) 및 제 2 ICP (1609) 에 기초하여 발생될 수도 있다. 방법 (2300) 은 전역-통과 필터를 이용하여 저-대역 중간 합성된 사이드 신호를 필터링하여 제 1 합성된 사이드 신호를 발생시키는 단계 및 전역-통과 필터의 다수의 스테이지들 중 적어도 하나의 적어도 하나의 파라미터를 조정하는 단계를 포함할 수도 있다. 예를 들어, 전역-통과 필터 (1630) 의 파라미터들 중 하나 이상은 도 16 을 참조하여 설명된 바와 같이, 저-대역 합성된 사이드 신호 (1674) 를 발생시킨 후 조정될 수도 있다. 방법 (2300) 은 전역-통과 필터를 이용하여 고-대역 중간 합성된 사이드 신호를 필터링하여 제 2 합성된 사이드 신호를 발생시키는 단계 및 제 1 합성된 사이드 신호와 제 2 합성된 사이드 신호를 결합하여 합성된 사이드 신호를 발생시키는 단계를 더 포함할 수도 있다. 예를 들어, 고-대역 합성된 사이드 신호 (1675) 는 도 16 을 참조하여 설명된 바와 같이, 조정된 파라미터 값들을 이용하여 고-대역 중간 합성된 사이드 신호 (1673) 를 필터링함으로써 발생될 수도 있다.
다른 특정의 구현예에서, 전역-통과 필터를 이용하여 중간 합성된 사이드 신호를 필터링하는 것은 필터링된 중간 합성된 사이드 신호를 발생시킨다. 이 구현예에서, 방법 (2300) 은 제 2 디바이스로부터 제 1 디바이스에서 상관 파라미터를 수신하는 단계 및 상관 파라미터에 기초하여, 중간 합성된 사이드 신호를 필터링된 중간 합성된 사이드 신호와 믹싱하여 합성된 사이드 신호를 발생시키는 단계를 포함한다. 예를 들어, 중간 합성된 사이드 신호 (1571) 및 필터링된 합성된 사이드 신호 (1573) 는 도 15 를 참조하여 설명된 바와 같이, 상관 파라미터 (1509) 에 기초하여 사이드 신호 믹서 (1590) 에서 믹싱될 수도 있다. 중간 합성된 사이드 신호와 믹싱되는 필터링된 중간 합성된 사이드 신호의 양은 도 15 를 참조하여 설명된 바와 같이, 상관 파라미터에서의 감소에 기초하여 증가될 수도 있다.
도 23 의 방법 (2300) 은 디코더에서 채널간 예측 이득 파라미터들을 이용한 합성된 미드 신호로부터의 합성된 사이드 신호의 예측 (예컨대, 맵핑) 을 가능하게 한다. 추가적으로, 방법 (2300) 은 합성된 미드 신호와 합성된 사이드 신호 사이의 상관을 감소시키고 (예컨대, 비상관을 증가시키고), 이는 제 1 오디오 신호와 제 2 오디오 신호 사이의 공간 차이를 증가시킬 수도 있으며, 이는 청취 경험을 향상시킬 수도 있다.
도 24 를 참조하면, 디바이스 (예컨대, 무선 통신 디바이스) 의 특정의 예시적인 예의 블록도가 도시되며, 일반적으로 2400 으로 지정된다. 다양한 양태들에서, 디바이스 (2400) 는 도 24 에 예시된 컴포넌트들보다 더 적거나 또는 더 많은 컴포넌트들을 가질 수도 있다. 예시적인 양태에서, 디바이스 (2400) 는 도 1 의, 제 1 디바이스 (104), 제 2 디바이스 (106), 도 2 의, 제 1 디바이스 (204), 제 2 디바이스 (206), 도 13 의, 제 1 디바이스 (1304), 제 2 디바이스 (1306), 또는 이들의 조합에 대응할 수도 있다. 예시적인 양태에서, 디바이스 (2400) 는 도 1 내지 도 23 의 시스템들 및 방법들을 참조하여 설명된 하나 이상의 동작들을 수행할 수도 있다.
특정한 양태에서, 디바이스 (2400) 는 프로세서 (2406) (예컨대, 중앙 처리 유닛 (CPU)) 를 포함한다. 디바이스 (2400) 는 하나 이상의 추가적인 프로세서들 (2410) (예컨대, 하나 이상의 디지털 신호 프로세서들 (DSPs)) 을 포함할 수도 있다. 프로세서들 (2410) 은 미디어 (예컨대, 음성 및 음악) 코더-디코더 (코덱) (2408), 및 에코 소거기 (2412) 를 포함할 수도 있다. 미디어 코덱 (2408) 은 디코더 (2418), 인코더 (2414), 또는 양자를 포함할 수도 있다. 인코더 (2414) 는 도 1 의 인코더 (114), 도 2 의 인코더 (214), 도 3 의 인코더 (314), 또는 도 13 의 인코더 (1314) 중 적어도 하나를 포함할 수도 있다. 디코더 (2418) 는 도 1 의 디코더 (118), 도 2 의 디코더 (218), 도 4 의 디코더 (418), 도 13 의 디코더 (1318), 도 14 의 디코더 (1418), 도 15 의 디코더 (1518), 또는 도 16 의 디코더 (1618) 중 적어도 하나를 포함할 수도 있다.
인코더 (2414) 는 채널간 정렬기 (108), CP 선택기 (122), 미드사이드 발생기 (148), 신호 발생기 (2416), 또는 ICP 발생기 (220) 중 적어도 하나를 포함할 수도 있다. 신호 발생기 (2416) 는 도 1 의 신호 발생기 (116), 도 2 의 신호 발생기 (216), 도 3 의 신호 발생기 (316), 도 4 의 신호 발생기 (450), 또는 도 13 의 신호 발생기 (1316) 중 적어도 하나를 포함할 수도 있다.
디코더 (2418) 는 CP 결정기 (172), 업믹스 파라미터 발생기 (176), 필터 (1375), 또는 신호 발생기 (2474) 중 적어도 하나를 포함할 수도 있다. 신호 발생기 (2474) 는 도 1 의 신호 발생기 (174), 도 2 의 신호 발생기 (274), 도 4 의 신호 발생기 (450), 도 13 의 신호 발생기 (1374), 도 14 의 신호 발생기 (1450), 도 15 의 신호 발생기 (1550), 또는 도 16 의 신호 발생기 (1650) 중 적어도 하나를 포함할 수도 있다.
디바이스 (2400) 는 메모리 (2453) 및 코덱 (2434) 을 포함할 수도 있다. 미디어 코덱 (2408) 이 프로세서들 (2410) 의 컴포넌트 (예컨대, 전용 회로부 및/또는 실행가능한 프로그래밍 코드) 로서 예시되지만, 다른 양태들에서, 디코더 (2418), 인코더 (2414), 또는 양쪽과 같은, 미디어 코덱 (2408) 의 하나 이상의 컴포넌트들이 프로세서 (2406), 코덱 (2434), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다.
디바이스 (2400) 는 안테나 (2442) 에 커플링된 트랜시버 (2440) 를 포함할 수도 있다. 트랜시버 (2440) 는 수신기 (2461), 송신기 (2411), 또는 양자를 포함할 수도 있다. 수신기 (2461) 는 도 1 의 수신기 (160), 도 2 의 수신기 (260), 또는 도 13 의 수신기 (1360) 중 적어도 하나를 포함할 수도 있다. 송신기 (2411) 는 도 1 의 송신기 (110), 도 2 의 송신기 (210), 또는 도 13 의 송신기 (1310) 중 적어도 하나를 포함할 수도 있다.
디바이스 (2400) 는 디스플레이 제어기 (2426) 에 커플링된 디스플레이 (2428) 를 포함할 수도 있다. 하나 이상의 스피커들 (2448) 이 코덱 (2434) 에 커플링될 수도 있다. 하나 이상의 마이크로폰들 (2446) 이 하나 이상의 입력 인터페이스(들) (2413) 를 통해서, 코덱 (2434) 에 커플링될 수도 있다. 입력 인터페이스(들) (2413) 는 도 1 의 입력 인터페이스(들) (112), 도 2 의 입력 인터페이스(들) (212), 또는 도 13 의 입력 인터페이스(들) (1312) 를 포함할 수도 있다.
특정의 양태에서, 스피커들 (2448) 은 도 1 의, 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 도 2 의, 제 1 라우드스피커 (242), 또는 제 2 라우드스피커 (244) 중 적어도 하나를 포함할 수도 있다. 특정의 양태에서, 마이크로폰들 (2446) 은 도 1 의, 제 1 마이크로폰 (146), 제 2 마이크로폰 (147), 도 2 의, 제 1 마이크로폰 (246), 또는 제 2 마이크로폰 (248) 중 적어도 하나를 포함할 수도 있다. 코덱 (2434) 은 디지털-대-아날로그 변환기 (DAC) (2402) 및 아날로그-대-디지털 변환기 (ADC) (2404) 를 포함할 수도 있다.
메모리 (2453) 는 도 1 내지 도 23 을 참조하여 설명된 하나 이상의 동작들을 수행하도록, 프로세서 (2406), 프로세서들 (2410), 코덱 (2434), 디바이스 (2400) 의 다른 프로세싱 유닛, 또는 이들의 조합에 의해 실행가능한 명령들 (2460) 을 포함할 수도 있다. 메모리 (2453) 는 도 1 내지 도 23 을 참조하여 설명된, 하나 이상의 신호들, 하나 이상의 파라미터들, 하나 이상의 임계치들, 하나 이상의 표시자들, 또는 이들의 조합을 저장할 수도 있다.
디바이스 (2400) 의 하나 이상의 컴포넌트들은 하나 이상의 태스크들, 또는 이들의 조합을 수행하는 명령들을 실행하는 프로세서에 의해, 전용 하드웨어 (예컨대, 회로부) 를 통해서 구현될 수도 있다. 일 예로서, 메모리 (2453) 또는 프로세서 (2406), 프로세서들 (2410), 및/또는 코덱 (2434) 의 하나 이상의 컴포넌트들은 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 전송 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈식 디스크, 또는 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은, 메모리 디바이스 (예컨대, 컴퓨터-판독가능 저장 디바이스) 일 수도 있다. 메모리 디바이스는 컴퓨터 (예컨대, 코덱 (2434) 내 프로세서, 프로세서 (2406), 및/또는 프로세서들 (2410)) 에 의해 실행될 때, 컴퓨터로 하여금, 도 1 내지 도 23 를 참조하여 설명된 하나 이상의 동작들을 수행하게 할 수도 있는 명령들 (예컨대, 명령들 (2460)) 을 포함할 (예컨대, 저장할) 수도 있다. 일 예로서, 메모리 (2453) 또는 프로세서 (2406), 프로세서들 (2410), 및/또는 코덱 (2434) 의 하나 이상의 컴포넌트들은 컴퓨터 (예컨대, 코덱 (2434) 내 프로세서, 프로세서 (2406), 및/또는 프로세서들 (2410)) 에 의해 실행될 때, 컴퓨터로 하여금, 도 1 내지 도 23 를 참조하여 설명된 하나 이상의 동작들을 수행하게 하는 명령들 (예컨대, 명령들 (2460)) 을 포함하는 비일시성 컴퓨터-판독가능 매체일 수도 있다.
특정한 양태에서, 디바이스 (2400) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (예컨대, 이동국 모뎀 (MSM)) (2422) 에 포함될 수도 있다. 특정한 양태에서, 프로세서 (2406), 프로세서들 (2410), 디스플레이 제어기 (2426), 메모리 (2453), 코덱 (2434), 및 트랜시버 (2440) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2422) 에 포함된다. 특정한 양태에서, 터치스크린 및/또는 키패드와 같은 입력 디바이스 (2430), 및 전원 (2444) 은 시스템-온-칩 디바이스 (2422) 에 커플링된다. 더욱이, 특정한 양태에서, 도 24 에 예시된 바와 같이, 디스플레이 (2428), 입력 디바이스 (2430), 스피커들 (2448), 마이크로폰들 (2446), 안테나 (2442), 및 전원 (2444) 은 시스템-온-칩 디바이스 (2422) 의 외부에 있다. 그러나, 디스플레이 (2428), 입력 디바이스 (2430), 스피커들 (2448), 마이크로폰들 (2446), 안테나 (2442), 및 전원 공급부 (2444) 각각은 인터페이스 또는 제어기와 같은, 시스템-온-칩 디바이스 (2422) 의 컴포넌트에 커플링될 수 있다.
디바이스 (2400) 는 무선 전화기, 모바일 통신 디바이스, 모바일 디바이스, 모바일 폰, 스마트 폰, 셀룰러폰, 랩탑 컴퓨터, 데스크탑 컴퓨터, 컴퓨터, 태블릿 컴퓨터, 셋 탑 박스, 개인 휴대정보 단말기 (PDA), 디스플레이 디바이스, 텔레비전, 게이밍 콘솔, 뮤직 플레이어, 라디오, 비디오 플레이어, 엔터테인먼트 유닛, 통신 디바이스, 고정 로케이션 데이터 유닛, 개인 미디어 플레이어, 디지털 비디오 플레이어, 디지털 비디오 디스크 (DVD) 플레이어, 튜너, 카메라, 네비게이션 디바이스, 디코더 시스템, 인코더 시스템, 미디어 브로드캐스트 디바이스, 또는 이들의 임의의 조합을 포함할 수도 있다.
특정의 양태에서, 도 1 내지 도 23 을 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (2400) 는 디코딩 시스템 또는 장치 (예컨대, 그 내의 전자 디바이스, 코덱, 또는 프로세서) 에, 인코딩 시스템 또는 장치에, 또는 양자에 통합될 수도 있다. 다른 양태들에서, 도 1 내지 도 23 을 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (2400) 는 모바일 디바이스, 무선 전화기, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 셋 탑 박스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 텔레비전, 게임 콘솔, 네비게이션 디바이스, 통신 디바이스, 개인 휴대정보 단말기 (PDA), 고정 로케이션 데이터 유닛, 개인 미디어 플레이어, 또는 다른 유형의 디바이스에 통합될 수도 있다.
도 1 내지 도 23 을 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들에 의해 수행되는 다양한 기능들 및 디바이스 (2400) 가 특정의 컴포넌트들 또는 모듈들에 의해 수행되는 것으로 설명된다는 점에 유의해야 한다. 컴포넌트들 및 모듈들의 이러한 분할은 단지 예시를 위한 것이다. 대안적인 양태에서, 특정의 컴포넌트 또는 모듈에 의해 수행되는 기능은 다수의 컴포넌트들 또는 모듈들 간에 분할될 수도 있다. 더욱이, 대안적인 양태에서, 도 1 내지 도 23 을 참조하여 설명된 2개 이상의 컴포넌트들 또는 모듈들은 단일 컴포넌트 또는 모듈에 통합될 수도 있다. 도 1 내지 도 23 을 참조하여 설명된 각각의 컴포넌트 또는 모듈은 하드웨어 (예컨대, 필드-프로그래밍가능 게이트 어레이 (FPGA) 디바이스, 주문형 집적 회로 (ASIC), DSP, 제어기, 등), 소프트웨어 (예컨대, 프로세서에 의해 실행가능한 명령들), 또는 이들의 임의의 조합을 이용하여 구현될 수도 있다.
설명되는 양태들과 관련하여, 장치는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를, 그리고 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 수단을 포함한다. 예를 들어, 미드 신호 및 사이드 신호를 발생시키는 수단은 도 1 의, 신호 발생기 (116), 인코더 (114), 또는 제 1 디바이스 (104), 도 2 의, 신호 발생기 (216), 인코더 (214), 또는 제 1 디바이스 (204), 도 3 의, 신호 발생기 (316) 또는 인코더 (314), 도 24 의, 신호 발생기 (2416), 인코더 (2414), 또는 프로세서 (2410), 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를, 그리고 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
본 장치는 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 수단을 포함한다. 예를 들어, 채널간 예측 이득 파라미터를 발생시키는 수단은 도 2 의, ICP 발생기 (220), 인코더 (214), 또는 제 1 디바이스 (204), 도 3 의, ICP 발생기 (320) 또는 인코더 (314), 도 24 의, ICP 발생기 (220), 인코더 (2414), 또는 프로세서 (2410), 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
본 장치는 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 수단을 더 포함한다. 예를 들어, 미드 신호 및 사이드 신호를 발생시키는 수단은 도 1 의, 송신기 (110) 또는 제 1 디바이스 (104), 도 2 의, 송신기 (210) 또는 제 1 디바이스 (204), 도 24 의, 송신기 (2410), 트랜시버 (2440), 또는 안테나 (2442), 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
설명되는 양태들과 관련하여, 장치는 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 예를 들어, 수신하는 수단은 도 1 의, 수신기 (160) 또는 제 2 디바이스 (106), 도 2 의, 수신기 (260) 또는 제 2 디바이스 (206), 도 24 의, 수신기 (2461), 트랜시버 (2440), 또는 안테나 (2442), 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다.
본 장치는 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 수단을 포함한다. 예를 들어, 합성된 미드 신호를 발생시키는 수단은 도 1 의, 신호 발생기 (174), 디코더 (118), 또는 제 2 디바이스 (106), 도 2 의, 신호 발생기 (274), 디코더 (218), 또는 제 2 디바이스 (206), 도 4 의, 신호 발생기 (450), 미드 신시사이저 (452), 또는 디코더 (418), 도 24 의, 신호 발생기 (2474), 디코더 (2418), 또는 프로세서 (2410), 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
본 장치는 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 합성된 사이드 신호를 발생시키는 수단을 더 포함한다. 예를 들어, 합성된 사이드 신호를 발생시키는 수단은 도 1 의, 신호 발생기 (174), 디코더 (118), 또는 제 2 디바이스 (106), 도 2 의, 신호 발생기 (274), 디코더 (218), 또는 제 2 디바이스 (206), 도 4 의, 신호 발생기 (450), 사이드 신시사이저 (456), 또는 디코더 (418), 도 24 의, 신호 발생기 (2474), 디코더 (2418), 또는 프로세서 (2410), 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
설명되는 양태들과 관련하여, 장치는 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 발생시키는 수단을 포함한다. 예를 들어, 복수의 파라미터들을 발생시키는 수단은 도 1 의, 채널간 정렬기 (108), 미드사이드 발생기 (148), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 도 6 의 GICP 발생기 (612), 도 8 의, 다운믹스 파라미터 발생기 (802), 파라미터 발생기 (806), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 복수의 파라미터들을 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 수단을 포함한다. 예를 들어, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 수단은 도 1 의, CP 선택기 (122), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다. 이 결정은 복수의 파라미터들 (예컨대, ICA 파라미터들 (107), 다운믹스 파라미터 (515), GICP (601), 다른 파라미터들 (810), 또는 이들의 조합) 에 기초할 수도 있다.
본 장치는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호 및 사이드 신호를 발생시키는 수단을 더 포함한다. 예를 들어, 미드 신호 및 사이드 신호를 발생시키는 수단은 도 1 의, 미드사이드 발생기 (148), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 미드 신호 및 사이드 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 적어도 하나의 인코딩된 신호를 발생시키는 수단을 포함한다. 예를 들어, 적어도 하나의 인코딩된 신호를 발생시키는 수단은 도 1 의, 신호 발생기 (116), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 적어도 하나의 인코딩된 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다. 적어도 하나의 인코딩된 신호는 미드 신호 (111) 에 대응하는 인코딩된 미드 신호 (121) 를 포함할 수도 있다. 적어도 하나의 인코딩된 신호는 사이드 신호 (113) 가 송신을 위해 인코딩되어야 한다는 결정에 응답하여, 사이드 신호 (113) 에 대응하는 인코딩된 사이드 신호 (123) 를 포함할 수도 있다.
본 장치는 적어도 하나의 인코딩된 신호에 대응하는 비트스트림 파라미터들을 송신하는 수단을 더 포함한다. 예를 들어, 송신하는 수단은 도 1 의, 송신기 (110), 제 1 디바이스 (104), 시스템 (100), 송신기 (2411), 트랜시버 (2440), 안테나 (2442), 디바이스 (2400), 비트스트림 파라미터들을 송신하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
또한, 설명된 양태들과 관련하여, 장치는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 수단을 포함한다. 예를 들어, 비트스트림 파라미터들을 수신하는 수단은 도 1 의, 수신기 (160), 제 2 디바이스 (106), 시스템 (100), 수신기 (2461), 트랜시버 (2440), 안테나 (2442), 디바이스 (2400), 비트스트림 파라미터들을 수신하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 수단을 포함한다. 예를 들어, 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 수단은 도 1 의, CP 결정기 (172), 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 디코더 (2418), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 합성된 미드 신호 및 합성된 사이드 신호를 발생시키는 수단을 더 포함한다. 예를 들어, 합성된 미드 신호 및 합성된 사이드 신호를 발생시키는 수단은 도 1 의 신호 발생기 (174), 도 1 의, 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 디코더 (2418), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 합성된 미드 신호 및 합성된 사이드 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다. 합성된 미드 신호 (171) 는 비트스트림 파라미터들 (102) 에 기초할 수도 있다. 특정의 양태에서, 합성된 사이드 신호 (173) 는 그 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하는지 여부의 결정에 응답하여, 비트스트림 파라미터들 (102) 에 선택적으로 기초한다. 예를 들어, 합성된 사이드 신호 (173) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응한다는 결정에 응답하여, 비트스트림 파라미터들 (102) 에 기초한다. 합성된 사이드 신호 (173) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다는 결정에 응답하여, 합성된 미드 신호 (171) 에 적어도 부분적으로 기초한다.
추가로, 설명된 양태들과 관련하여, 장치는 다운믹스 파라미터 및 미드 신호를 발생시키는 수단을 포함한다. 예를 들어, 다운믹스 파라미터 및 미드 신호를 발생시키는 수단은 도 1 의, 미드사이드 발생기 (148), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 도 8 의, 다운믹스 파라미터 발생기 (802), 파라미터 발생기 (806), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 다운믹스 파라미터 및 미드 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다. 다운믹스 파라미터 (115) 는 사이드 신호 (113) 가 송신을 위해 인코딩되어야 한다고 CP 파라미터 (109) 가 표시한다는 결정에 응답하여, 다운믹스 파라미터 값 (807) (예컨대, 제 1 값) 을 가질 수도 있다. 다운믹스 파라미터 (115) 는 사이드 신호 (113) 가 송신을 위해 인코딩되지 않아야 한다는 것을 CP 파라미터 (109) 가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여, 다운믹스 파라미터 값 (805) (예컨대, 제 2 값) 을 가질 수도 있다. 다운믹스 파라미터 값 (807) 은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초할 수도 있다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초할 수도 있다. 다운믹스 파라미터 값 (805) 은 디폴트 다운믹스 파라미터 값 (예컨대, 0.5), 다운믹스 파라미터 값 (807), 또는 양자에 기초할 수도 있다. 미드 신호 (111) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 및 다운믹스 파라미터 (115) 에 기초할 수도 있다.
본 장치는 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 수단을 포함한다. 예를 들어, 인코딩된 미드 신호를 발생시키는 수단은 도 1 의, 신호 발생기 (116), 인코더 (114), 제 1 디바이스 (104), 시스템 (100), 인코더 (2414), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 인코딩된 미드 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 송신하는 수단을 더 포함한다. 예를 들어, 송신하는 수단은 도 1 의, 송신기 (110), 제 1 디바이스 (104), 시스템 (100), 송신기 (2411), 트랜시버 (2440), 안테나 (2442), 디바이스 (2400), 비트스트림 파라미터들을 송신하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
또한, 설명된 양태들과 관련하여, 장치는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 수단을 포함한다. 예를 들어, 비트스트림 파라미터들을 수신하는 수단은 도 1 의, 수신기 (160), 제 2 디바이스 (106), 시스템 (100), 수신기 (2461), 트랜시버 (2440), 안테나 (2442), 디바이스 (2400), 비트스트림 파라미터들을 수신하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 하나 이상의 업믹스 파라미터들을 발생시키는 수단을 더 포함한다. 예를 들어, 하나 이상의 업믹스 파라미터들을 발생시키는 수단은 도 1 의, 업믹스 파라미터 발생기 (176), 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 디코더 (2418), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 업믹스 파라미터를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다. 하나 이상의 업믹스 파라미터들은 업믹스 파라미터 (175) 를 포함할 수도 있다. 업믹스 파라미터 (175) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하는지 여부의 결정에 기초하여, 다운믹스 파라미터 값 (807) (예컨대, 제 1 값) 또는 다운믹스 파라미터 값 (805) (예컨대, 제 2 값) 을 가질 수도 있다. 예를 들어, 업믹스 파라미터 (175) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응한다는 결정에 응답하여, 다운믹스 파라미터 값 (807) (예컨대, 제 1 값) 을 가질 수도 있다. 다운믹스 파라미터 값 (807) 은 다운믹스 파라미터 (115) 에 기초할 수도 있다. 수신기 (160) 는 다운믹스 파라미터 값 (807) 을 수신할 수도 있다. 업믹스 파라미터 (175) 는 비트스트림 파라미터들 (102) 이 인코딩된 사이드 신호 (123) 에 대응하지 않는다고 결정하는 것에 적어도 부분적으로 기초하여, 다운믹스 파라미터 값 (805) (예컨대, 제 2 값) 을 가질 수도 있다. 다운믹스 파라미터 값 (805) 은 디폴트 파라미터 값 (예컨대, 0.5) 에 적어도 부분적으로 기초할 수도 있다.
본 장치는 또한 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 수단을 포함한다. 예를 들어, 합성된 미드 신호를 발생시키는 수단은 도 1 의 신호 발생기 (174), 도 1 의, 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 디코더 (2418), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 합성된 미드 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 적어도 합성된 미드 신호 및 하나 이상의 업믹스 파라미터들에 기초하여 출력 신호를 발생시키는 수단을 더 포함한다. 예를 들어, 출력 신호를 발생시키는 수단은 도 1 의 신호 발생기 (174), 도 1 의, 디코더 (118), 제 2 디바이스 (106), 시스템 (100), 디코더 (2418), 미디어 코덱 (2408), 프로세서들 (2410), 디바이스 (2400), 출력 신호를 발생시키도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터-판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
설명되는 양태들과 관련하여, 장치는 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 예를 들어, 수신하는 수단은 도 13 의, 수신기 (1360) 또는 제 2 디바이스 (1306), 도 24 의, 수신기 (2461), 트랜시버 (2440), 또는 안테나 (2442), 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다.
본 장치는 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 수단을 포함한다. 예를 들어, 합성된 미드 신호를 발생시키는 수단은 도 13 의, 신호 발생기 (1374), 디코더 (1318), 또는 제 2 디바이스 (1306), 도 14 의, 신호 발생기 (1450), 미드 신시사이저 (1452), 또는 디코더 (1418), 도 15 의, 신호 발생기 (1550), 미드 신시사이저 (1552), 또는 디코더 (1518), 도 16 의, 신호 발생기 (1650), 미드 신시사이저 (1652), 또는 디코더 (1618), 도 24 의, 신호 발생기 (2474), 디코더 (2418), 또는 프로세서 (2410), 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
본 장치는 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 수단을 포함한다. 예를 들어, 중간 합성된 사이드 신호를 발생시키는 수단은 도 13 의, 신호 발생기 (1374), 디코더 (1318), 또는 제 2 디바이스 (1306), 도 4 의, 신호 발생기 (1450), 사이드 신시사이저 (1456), 또는 디코더 (1418), 도 15 의, 신호 발생기 (1550), 사이드 신시사이저 (1556), 또는 디코더 (1518), 도 16 의, 신호 발생기 (1650), 사이드 신시사이저 (1656), 또는 디코더 (1618), 도 24 의, 신호 발생기 (2474), 디코더 (2418), 또는 프로세서 (2410), 인코딩된 미드 신호에 기초하여 중간 합성된 미드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
본 장치는 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 수단을 더 포함한다. 예를 들어, 필터링하는 수단은 도 13 의 필터 (1375), 도 14 의 전역-통과 필터 (1430), 도 15 의 전역-통과 필터 (1530), 도 16 의 전역-통과 필터 (1630), 도 24 의 필터 (1375), 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키도록 구성된 하나 이상의 구조들, 디바이스들, 또는 회로들, 또는 이들의 조합을 포함할 수도 있다.
도 25 를 참조하면, 기지국 (2500) (예컨대, 기지국 디바이스) 의 특정의 예시적인 예의 블록도가 도시된다. 여러 구현예들에서, 기지국 (2500) 은 도 25 에 예시된 것보다 더 많은 컴포넌트들 또는 더 적은 컴포넌트들을 가질 수도 있다. 예시적인 예에서, 기지국 (2500) 은 도 1 의, 제 1 디바이스 (104), 제 2 디바이스 (106), 도 2 의, 제 1 디바이스 (204), 제 2 디바이스 (206), 도 13 의, 제 1 디바이스 (1304), 제 2 디바이스 (1306), 또는 이들의 조합을 포함할 수도 있다. 예시적인 예에서, 기지국 (2500) 은 도 1 내지 도 24 를 참조하여 설명된 방법들 또는 시스템들 중 하나 이상에 따라서 동작할 수도 있다.
기지국 (2500) 은 무선 통신 시스템의 부분일 수도 있다. 무선 통신 시스템은 다수의 기지국들 및 다수의 무선 디바이스들을 포함할 수도 있다. 무선 통신 시스템은 롱텀 에볼류션 (LTE) 시스템, 코드분할 다중접속 (CDMA) 시스템, GSM (Global System for Mobile Communications) 시스템, 무선 로컬 영역 네트워크 (WLAN) 시스템, 또는 어떤 다른 무선 시스템일 수도 있다. CDMA 시스템은 광대역 CDMA (WCDMA), CDMA 1X, EVDO (Evolution-Data Optimized), 시분할 동기 CDMA (TD-SCDMA), 또는 CDMA 의 어떤 다른 버전을 구현할 수도 있다.
무선 디바이스들은 또한 사용자 장비 (UE), 이동국, 터미널, 액세스 단말기, 가입자 유닛, 스테이션, 등으로서 지칭될 수도 있다. 무선 디바이스들은 셀룰러폰, 스마트폰, 태블릿, 무선 모뎀, 개인 휴대정보 단말기 (PDA), 핸드헬드 디바이스, 랩탑 컴퓨터, 스마트북, 넷북, 태블릿, 코드리스 폰, 무선 가입자 회선 (WLL) 국, 블루투스 디바이스, 등을 포함할 수도 있다. 무선 디바이스들은 도 24 의 디바이스 (2400) 를 포함하거나 또는 이에 대응할 수도 있다.
메시지들 및 데이터 (예컨대, 오디오 데이터) 를 전송하고 수신하는 것과 같은, 여러 기능들이 기지국 (2500) 의 하나 이상의 컴포넌트들에 의해 (및/또는 미도시된 다른 컴포넌트들에서) 수행될 수도 있다. 특정의 예에서, 기지국 (2500) 은 프로세서 (2506) (예컨대, CPU) 를 포함한다. 기지국 (2500) 은 트랜스코더 (2510) 를 포함할 수도 있다. 트랜스코더 (2510) 는 오디오 코덱 (2508) 을 포함할 수도 있다. 예를 들어, 트랜스코더 (2510) 는 오디오 코덱 (2508) 의 동작들을 수행하도록 구성된 하나 이상의 컴포넌트들 (예컨대, 회로부) 을 포함할 수도 있다. 다른 예로서, 트랜스코더 (2510) 는 오디오 코덱 (2508) 의 동작들을 수행하는 하나 이상의 컴퓨터-판독가능 명령들을 실행하도록 구성될 수도 있다. 오디오 코덱 (2508) 이 트랜스코더 (2510) 의 컴포넌트로서 예시되지만, 다른 예들에서, 오디오 코덱 (2508) 의 하나 이상의 컴포넌트들이 프로세서 (2506), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다. 예를 들어, 디코더 (2538) (예컨대, 보코더 디코더) 는 수신기 데이터 프로세서 (2564) 에 포함될 수도 있다. 다른 예로서, 인코더 (2536) (예컨대, 보코더 인코더) 는 송신 데이터 프로세서 (2582) 에 포함될 수도 있다.
트랜스코더 (2510) 는 2개 이상의 네트워크들 사이에서 메시지들 및 데이터를 트랜스코딩하도록 기능할 수도 있다. 트랜스코더 (2510) 는 메시지 및 오디오 데이터를 제 1 포맷 (예컨대, 디지털 포맷) 으로부터 제 2 포맷으로 변환하도록 구성될 수도 있다. 예시하기 위하여, 디코더 (2538) 는 제 1 포맷을 가지는 인코딩된 신호들을 디코딩할 수도 있으며, 인코더 (2536) 는 디코딩된 신호들을 제 2 포맷을 가지는 인코딩된 신호들로 인코딩할 수도 있다. 추가적으로 또는 대안적으로, 트랜스코더 (2510) 는 데이터 레이트 적응을 수행하도록 구성될 수도 있다. 예를 들어, 트랜스코더 (2510) 는 오디오 데이터의 포맷을 변경함이 없이, 데이터 레이트를 상향변환하거나 또는 데이터 레이트를 하향변환할 수도 있다. 예시하기 위하여, 트랜스코더 (2510) 는 초당 64 킬로비트 (kbit/s) 신호들을 16 kbit/s 신호들로 하향변환할 수도 있다.
오디오 코덱 (2508) 은 인코더 (2536) 및 디코더 (2538) 를 포함할 수도 있다. 인코더 (2536) 는 도 1 의 인코더 (114), 도 2 의 인코더 (214), 도 3 의 인코더 (314), 또는 도 13 의 인코더 (1314) 중 적어도 하나를 포함할 수도 있다. 디코더 (2538) 는 도 1 의 디코더 (118), 도 2 의 디코더 (218), 도 4 의 디코더 (418), 도 13 의 디코더 (1318), 도 14 의 디코더 (1418), 도 15 의 디코더 (1518), 또는 도 16 의 디코더 (1618) 중 적어도 하나를 포함할 수도 있다.
기지국 (2500) 은 메모리 (2532) 를 포함할 수도 있다. 컴퓨터-판독가능 저장 디바이스와 같은, 메모리 (2532) 는 명령들을 포함할 수도 있다. 명령들은 도 1 내지 도 24 의 방법들 및 시스템들을 참조하여 설명된 하나 이상의 동작들을 수행하도록, 프로세서 (2506), 트랜스코더 (2510), 또는 이들의 조합에 의해, 실행가능한 하나 이상의 명령들을 포함할 수도 있다. 기지국 (2500) 은 안테나들의 어레이에 커플링된, 제 1 트랜시버 (2552) 및 제 2 트랜시버 (2554) 와 같은, 다수의 송신기들 및 수신기들 (예컨대, 트랜시버들) 을 포함할 수도 있다. 안테나들의 어레이는 제 1 안테나 (2542) 및 제 2 안테나 (2544) 를 포함할 수도 있다. 안테나들의 어레이는 도 24 의 디바이스 (2400) 와 같은 하나 이상의 무선 디바이스들과 무선으로 통신하도록 구성될 수도 있다. 예를 들어, 제 2 안테나 (2544) 는 무선 디바이스로부터 데이터 스트림 (2514) (예컨대, 비트 스트림) 을 수신할 수도 있다. 데이터 스트림 (2514) 은 메시지들, 데이터 (예컨대, 인코딩된 음성 데이터), 또는 이들의 조합을 포함할 수도 있다.
기지국 (2500) 은 백홀 접속부와 같은, 네트워크 접속부 (2560) 를 포함할 수도 있다. 네트워크 접속부 (2560) 는 무선 통신 네트워크의 하나 이상의 기지국들 또는 코어 네트워크와 통신하도록 구성될 수도 있다. 예를 들어, 기지국 (2500) 은 코어 네트워크로부터 네트워크 접속부 (2560) 를 통해서 제 2 데이터 스트림 (예컨대, 메시지들 또는 오디오 데이터) 을 수신할 수도 있다. 기지국 (2500) 은 제 2 데이터 스트림을 프로세싱하여 메시지들 또는 오디오 데이터를 발생시키고, 메시지들 또는 오디오 데이터를 안테나들의 어레이의 하나 이상의 안테나들을 통해서 하나 이상의 무선 디바이스에 또는 네트워크 접속부 (2560) 를 통해서 다른 기지국에 제공할 수도 있다. 특정의 구현예에서, 네트워크 접속부 (2560) 는 예시적인, 비한정적인 예로서 광역 네트워크 (WAN) 접속부일 수도 있다. 일부 구현예들에서, 코어 네트워크는 공중 교환 전화 네트워크 (PSTN), 패킷 백본 네트워크, 또는 양자를 포함하거나 또는 이들에 대응할 수도 있다.
기지국 (2500) 은 네트워크 접속부 (2560) 및 프로세서 (2506) 에 커플링된 미디어 게이트웨이 (2570) 를 포함할 수도 있다. 미디어 게이트웨이 (2570) 는 상이한 원격 통신들 기술들의 미디어 스트림들 사이에 변환하도록 구성될 수도 있다. 예를 들어, 미디어 게이트웨이 (2570) 는 상이한 송신 프로토콜들, 상이한 코딩 방식들, 또는 양자 사이를 변환할 수도 있다. 예시하기 위하여, 미디어 게이트웨이 (2570) 는 예시적인, 비한정적인 예로서, PCM 신호들로부터 실시간 전송 프로토콜 (RTP) 신호들로 변환할 수도 있다. 미디어 게이트웨이 (2570) 는 패킷 교환 네트워크들 (예컨대, VoIP (Voice over Internet Protocol) 네트워크, IP 멀티미디어 서브시스템 (IMS), 4세대 (4G) 무선 네트워크, 예컨대 LTE, WiMax, 및 UMB, 등), 회선 스위칭 네트워크들 (예컨대, PSTN), 및 하이브리드 네트워크들 (예컨대, 2세대 (2G) 무선 네트워크, 예컨대 GSM, GPRS, 및 에지, 3세대 (3G) 무선 네트워크, 예컨대 WCDMA, EV-DO, 및 HSPA, 등) 사이의 데이터를 변환할 수도 있다.
추가적으로, 미디어 게이트웨이 (2570) 는 트랜스코더 (2510) 와 같은 트랜스코더를 포함할 수도 있으며, 코덱들이 호환불가능할 때 데이터를 트랜스코딩하도록 구성될 수도 있다. 예를 들어, 미디어 게이트웨이 (2570) 는 예시적인, 비한정적인 예로서, 적응적 멀티-레이트 (AMR) 코덱과 G.(711) 코덱 사이에 트랜스코딩할 수도 있다. 미디어 게이트웨이 (2570) 는 라우터 및 복수의 물리적인 인터페이스들을 포함할 수도 있다. 일부 구현예들에서, 미디어 게이트웨이 (2570) 는 또한 제어기 (미도시) 를 포함할 수도 있다. 특정의 구현예에서, 미디어 게이트웨이 제어기는 미디어 게이트웨이 (2570) 의 외부에 있거나, 기지국 (2500) 의 외부에 있거나, 또는 양자일 수도 있다. 미디어 게이트웨이 제어기는 다수의 미디어 게이트웨이들의 동작들을 제어하고 조정할 수도 있다. 미디어 게이트웨이 (2570) 는 미디어 게이트웨이 제어기로부터 제어 신호들을 수신할 수도 있으며, 상이한 송신 기술들 사이를 브릿지하도록 기능할 수도 있으며, 최종-사용자 능력들 및 접속들에 서비스를 추가할 수도 있다.
기지국 (2500) 은 트랜시버들 (2552, 2554), 수신기 데이터 프로세서 (2564), 및 프로세서 (2506) 에 커플링된 복조기 (2562) 를 포함할 수도 있으며, 수신기 데이터 프로세서 (2564) 는 프로세서 (2506) 에 커플링될 수도 있다. 복조기 (2562) 는 트랜시버들 (2552, 2554) 로부터 수신된 변조된 신호들을 복조하여, 복조된 데이터를 수신기 데이터 프로세서 (2564) 에 제공하도록 구성될 수도 있다. 수신기 데이터 프로세서 (2564) 는 복조된 데이터로부터 메시지 또는 오디오 데이터를 추출하여 메시지 또는 오디오 데이터를 프로세서 (2506) 로 전송하도록 구성될 수도 있다.
기지국 (2500) 은 송신 데이터 프로세서 (2582) 및 송신 다중 입력-다중 출력 (MIMO) 프로세서 (2584) 를 포함할 수도 있다. 송신 데이터 프로세서 (2582) 는 프로세서 (2506) 및 송신 MIMO 프로세서 (2584) 에 커플링될 수도 있다. 송신 MIMO 프로세서 (2584) 는 트랜시버들 (2552, 2554) 및 프로세서 (2506) 에 커플링될 수도 있다. 일부 구현예들에서, 송신 MIMO 프로세서 (2584) 는 미디어 게이트웨이 (2570) 에 커플링될 수도 있다. 송신 데이터 프로세서 (2582) 는 프로세서 (2506) 로부터 메시지들 또는 오디오 데이터를 수신하여, 예시적인, 비한정적인 예들로서, CDMA 또는 직교 주파수-분할 멀티플렉싱 (OFDM) 과 같은 코딩 방식에 기초하여 메시지들 또는 오디오 데이터를 코딩하도록 구성될 수도 있다. 송신 데이터 프로세서 (2582) 는 코딩된 데이터를 송신 MIMO 프로세서 (2584) 에 제공할 수도 있다.
코딩된 데이터는 멀티플렉싱된 데이터를 발생시키기 위해 CDMA 또는 OFDM 기법들을 이용하여 파일럿 데이터와 같은 다른 데이터와 멀티플렉싱될 수도 있다. 멀티플렉싱된 데이터는 그후 변조 심볼들을 발생시키기 위해 특정의 변조 방식 (예컨대, 2진 위상-시프트 키잉 ("BPSK"), 직교 위상-시프트 키잉 ("QSPK"), M-ary 위상-시프트 키잉 ("M-PSK"), M-ary 직교 진폭 변조 ("M-QAM"), 등) 에 기초하여 송신 데이터 프로세서 (2582) 에 의해 변조될 (즉, 심볼 맵핑될) 수도 있다. 특정의 구현예에서, 코딩된 데이터 및 다른 데이터는 상이한 변조 방식들을 이용하여 변조될 수도 있다. 각각의 데이터 스트림에 대한 데이터 레이트, 코딩, 및 변조는 프로세서 (2506) 에 의해 실행되는 명령들에 의해 결정될 수도 있다.
송신 MIMO 프로세서 (2584) 는 송신 데이터 프로세서 (2582) 로부터 변조 심볼들을 수신하도록 구성될 수도 있으며, 변조 심볼들을 추가로 프로세싱할 수도 있으며 데이터에 대해 빔형성을 수행할 수도 있다. 예를 들어, 송신 MIMO 프로세서 (2584) 는 빔형성 가중치들을 변조 심볼들에 적용할 수도 있다. 빔형성 가중치들은 변조 심볼들이 송신되는 안테나들의 어레이의 하나 이상의 안테나들에 대응할 수도 있다.
동작 동안, 기지국 (2500) 의 제 2 안테나 (2544) 는 데이터 스트림 (2514) 을 수신할 수도 있다. 제 2 트랜시버 (2554) 는 제 2 안테나 (2544) 로부터 데이터 스트림 (2514) 을 수신할 수도 있으며 데이터 스트림 (2514) 을 복조기 (2562) 에 제공할 수도 있다. 복조기 (2562) 는 데이터 스트림 (2514) 의 변조된 신호들을 복조하여 복조된 데이터를 수신기 데이터 프로세서 (2564) 에 제공할 수도 있다. 수신기 데이터 프로세서 (2564) 는 복조된 데이터로부터 오디오 데이터를 추출하여, 추출된 오디오 데이터를 프로세서 (2506) 에 제공할 수도 있다.
프로세서 (2506) 는 트랜스코딩을 위해 오디오 데이터를 트랜스코더 (2510) 에 제공할 수도 있다. 트랜스코더 (2510) 의 디코더 (2538) 는 오디오 데이터를 제 1 포맷으로부터 디코딩된 오디오 데이터로 디코딩할 수도 있으며, 인코더 (2536) 는 디코딩된 오디오 데이터를 제 2 포맷으로 인코딩할 수도 있다. 일부 구현예들에서, 인코더 (2536) 는 무선 디바이스로부터 수신된 것보다 더 높은 데이터 레이트 (예컨대, 상향변환) 또는 더 낮은 데이터 레이트 (예컨대, 하향변환) 를 이용하여 오디오 데이터를 인코딩할 수도 있다. 다른 구현예들에서, 오디오 데이터는 트랜스코딩되지 않을 수도 있다. 트랜스코딩 (예컨대, 디코딩 및 인코딩) 이 트랜스코더 (2510) 에 의해 수행되는 것으로 예시되지만, 트랜스코딩 동작들 (예컨대, 디코딩 및 인코딩) 은 기지국 (2500) 의 다수의 컴포넌트들에 의해 수행될 수도 있다. 예를 들어, 디코딩은 수신기 데이터 프로세서 (2564) 에 의해 수행될 수도 있으며, 인코딩은 송신 데이터 프로세서 (2582) 에 의해 수행될 수도 있다. 일부 구현예들에서, 프로세서 (2506) 는 다른 송신 프로토콜, 코딩 방식, 또는 양자로의 변환을 위해 오디오 데이터를 미디어 게이트웨이 (2570) 에 제공할 수도 있다. 미디어 게이트웨이 (2570) 는 변환된 데이터를 네트워크 접속부 (2560) 를 통해서 다른 기지국 또는 코어 네트워크에 제공할 수도 있다.
인코더 (2536) 는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여 CP 파라미터들 (109) 을 발생시킬 수도 있다. 인코더 (2536) 는 다운믹스 파라미터 (115) 를 결정할 수도 있다. 인코더 (2536) 는 다운믹스 파라미터 (115) 에 기초하여 미드 신호 (111) 및 사이드 신호 (113) 를 발생시킬 수도 있다. 인코더 (2536) 는 적어도 하나의 인코딩된 신호에 대응하는 비트스트림 파라미터들 (102) 을 발생시킬 수도 있다. 예를 들어, 비트스트림 파라미터들 (102) 은 인코딩된 미드 신호 (121) 에 대응한다. 비트스트림 파라미터들 (102) 은 CP 파라미터 (109) 에 기초하여 인코딩된 사이드 신호 (123) 에 대응할 수도 있다. 인코더 (2536) 는 또한 CP 파라미터 (109) 에 기초하여 ICP (208) 를 발생시킬 수도 있다. 트랜스코딩된 데이터와 같은, 인코더 (2536) 에서 발생된 인코딩된 오디오 데이터는 프로세서 (2506) 를 경유하여 송신 데이터 프로세서 (2582) 또는 네트워크 접속부 (2560) 에 제공될 수도 있다.
트랜스코더 (2510) 로부터의 트랜스코딩된 오디오 데이터는 OFDM 과 같은, 변조 방식에 따라서 코딩하여 변조 심볼들을 발생시키기 위해 송신 데이터 프로세서 (2582) 에 제공될 수도 있다. 송신 데이터 프로세서 (2582) 는 추가적인 프로세싱 및 빔형성을 위해 변조 심볼들을 송신 MIMO 프로세서 (2584) 에 제공할 수도 있다. 송신 MIMO 프로세서 (2584) 는 빔형성 가중치들을 적용할 수도 있으며, 변조 심볼들을 제 1 트랜시버 (2552) 를 통해서 제 1 안테나 (2542) 와 같은, 안테나들의 어레이의 하나 이상의 안테나들에 제공할 수도 있다. 따라서, 기지국 (2500) 은 무선 디바이스로부터 수신된 데이터 스트림 (2514) 에 대응할 수도 있는 트랜스코딩된 데이터 스트림 (2516) 을 다른 무선 디바이스에 제공할 수도 있다. 트랜스코딩된 데이터 스트림 (2516) 은 데이터 스트림 (2514) 과는 상이한 인코딩 포맷, 데이터 레이트, 또는 양쪽을 가질 수도 있다. 다른 구현예들에서, 트랜스코딩된 데이터 스트림 (2516) 은 다른 기지국 또는 코어 네트워크로의 송신을 위해 네트워크 접속부 (2560) 에 제공될 수도 있다.
특정의 양태에서, 디코더 (2538) 는 비트스트림 파라미터들 (102) 및 선택적으로 ICP (208) 를 수신한다. 디코더 (2538) 는 CP 파라미터 (179) 및 업믹스 파라미터 (175) 를 결정할 수도 있다. 디코더 (2538) 는 합성된 미드 신호 (171) 를 발생시킬 수도 있다. 디코더 (2538) 는 CP 파라미터 (179) 에 기초하여 합성된 사이드 신호 (173) 를 발생시킬 수도 있다. 예를 들어, 디코더 (2538) 는 CP 파라미터 (179) 가 제 1 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 비트스트림 파라미터들 (102) 을 디코딩함으로써, 합성된 사이드 신호 (173) 를 발생시킬 수도 있다. 다른 예로서, 디코더 (2538) 는 CP 파라미터 (179) 가 제 2 값 (예컨대, 1) 을 갖는다고 결정하는 것에 응답하여, 합성된 미드 신호 (171) 및 ICP (208) 에 기초하여, 합성된 사이드 신호 (173) 를 발생시킬 수도 있다. 일부 구현예들에서, 디코더 (2538) 는 도 13 내지 도 16 을 참조하여 설명된 바와 같이, 전역-통과 필터를 이용하여 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호 (173) 를 발생시킬 수도 있다. 디코더 (2538) 는 업믹스 파라미터 (175) 에 기초하여, 합성된 미드 신호 (171) 와 합성된 사이드 신호 (173) 를 업믹싱함으로써, 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 를 발생시킬 수도 있다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 동작들은 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 것을 포함한다. 동작들은 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 것을 포함한다. 동작들은 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 것을 더 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 동작들은 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 합성된 사이드 신호를 발생시키는 것을 더 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 동작들은 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 것을 포함한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 것을 더 포함한다. 동작들은 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 것을 포함한다. 동작들은 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함한다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 포함한다. 동작들은 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 동작들은 또한 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 것을 더 포함한다. 동작들은 또한 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 비트스트림 파라미터들에 기초하여 합성된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하지 않는다고 결정하는 것에 응답하여, 합성된 미드 신호에 적어도 부분적으로 기초하여, 합성된 사이드 신호를 발생시키는 것을 더 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 동작들은 또한 비트스트림 파라미터들에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하는지 여부를 결정하는 것을 더 포함한다. 동작들은 또한 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응한다고 결정하는 것에 응답하여, 제 1 값을 가지는 업믹스 파라미터를 발생시키는 것을 포함한다. 제 1 값은 수신된 다운믹스 파라미터에 기초한다. 동작들은 비트스트림 파라미터들이 인코딩된 사이드 신호에 대응하지 않는다고 결정하는 것에 적어도 부분적으로 기초하여, 제 2 값을 가지는 업믹스 파라미터를 발생시키는 것을 더 포함한다. 제 2 값은 디폴트 파라미터 값에 적어도 부분적으로 기초한다. 동작들은 또한 적어도 합성된 미드 신호 및 업믹스 파라미터에 기초하여 출력 신호를 발생시키는 것을 포함한다.
기지국 (2500) 은 프로세서 (예컨대, 프로세서 (2506) 또는 트랜스코더 (2510)) 에 의해 실행될 때, 프로세서로 하여금, 제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스 (예컨대, 메모리 (2532)) 를 포함할 수도 있다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 동작들은 제 1 디바이스에서, 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 것을 포함한다. 동작들은 합성된 미드 신호 및 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키는 것을 더 포함한다.
특정의 양태에서, 디바이스는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키도록 구성된 인코더를 포함한다. 인코더는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키도록 구성된다. 인코더는 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키도록 추가로 구성된다. 디바이스는 또한 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하도록 구성된 송신기를 포함한다. 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함한다. 송신기는 채널간 예측 이득 파라미터를 전송하는 것에 응답하여, 인코딩된 사이드 신호의 하나 이상의 오디오 프레임들을 전송하는 것을 억제하도록 추가로 구성된다. 채널간 예측 이득 파라미터는 인코딩된 오디오 신호의 제 1 오디오 프레임과 연관된 제 1 값을 갖는다. 채널간 예측 이득 파라미터는 인코딩된 오디오 신호의 제 2 오디오 프레임과 연관된 제 2 값을 갖는다.
특정의 구현예에서, 채널간 예측 이득 파라미터는 미드 신호의 에너지 레벨 및 사이드 신호의 에너지 레벨에 기초한다. 인코더는 사이드 신호의 에너지 레벨과 미드 신호의 에너지 레벨의 비를 결정하도록 구성된다. 채널간 예측 이득 파라미터는 비에 기초한다.
특정의 구현예에서, 채널간 예측 이득 파라미터는 사이드 신호의 에너지 레벨에 기초한다. 특정의 구현예에서, 채널간 예측 이득 파라미터는 미드 신호, 사이드 신호, 및 미드 신호의 에너지 레벨에 기초한다. 인코더는 미드 신호의 에너지 레벨과, 미드 신호와 사이드 신호의 내적의 비를 발생시키도록 구성된다. 채널간 예측 이득 파라미터는 비에 기초한다.
특정의 구현예에서, 채널간 예측 이득 파라미터는 합성된 미드 신호, 사이드 신호, 및 합성된 미드 신호의 에너지 레벨에 기초한다. 인코더는 합성된 미드 신호의 에너지 레벨과, 합성된 미드 신호와 사이드 신호의 내적의 비를 발생시키도록 구성된다. 채널간 예측 이득 파라미터는 비에 기초한다. 특정의 구현예에서, 인코더는 채널간 예측 이득 파라미터를 발생시키기 전에, 하나 이상의 필터들을 미드 신호 및 사이드 신호에 적용하도록 구성된다. 특정의 구현예에서, 인코더 및 송신기는 모바일 디바이스에 통합된다. 특정의 구현예에서, 인코더 및 송신기는 기지국에 통합된다.
특정의 양태에서, 방법은 제 1 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 미드 신호 및 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 단계를 포함한다. 방법은 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 제 2 디바이스로 전송하는 단계를 더 포함한다. 특정의 구현예에서, 제 1 디바이스는 모바일 디바이스를 포함한다. 특정의 구현예에서, 제 1 디바이스는 기지국을 포함한다.
본 방법은 제 1 오디오 신호를 다운샘플링하여 제 1 다운샘플링된 오디오 신호를 발생시키는 단계를 포함한다. 방법은 또한 제 2 오디오 신호를 다운샘플링하여 제 2 다운샘플링된 오디오 신호를 발생시키는 단계를 포함한다. 채널간 예측 이득 파라미터는 제 1 다운샘플링된 오디오 신호 및 제 2 다운샘플링된 오디오 신호에 기초한다. 채널간 예측 이득 파라미터는 제 1 오디오 신호 및 제 2 오디오 신호와 연관된 입력 샘플링 레이트에서 결정된다.
본 방법은 채널간 예측 이득 파라미터를 제 2 디바이스로 전송하기 전에 채널간 예측 이득 파라미터에 대해 평활화 동작을 수행하는 단계를 포함한다. 특정의 구현예에서, 평활화 동작은 고정된 평활화 인자에 기초한다. 특정의 구현예에서, 평활화 동작은 적응적 평활화 인자에 기초한다. 특정의 구현예에서, 적응적 평활화 인자는 미드 신호의 신호 에너지에 기초한다. 특정의 구현예에서, 적응적 평활화 인자는 미드 신호와 연관된 보이싱 파라미터에 기초한다.
본 방법은 미드 신호를 프로세싱하여 저-대역 미드 신호 및 고-대역 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 또한 사이드 신호를 프로세싱하여 저-대역 사이드 신호 및 고-대역 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 저-대역 미드 신호 및 저-대역 사이드 신호에 기초하여 채널간 예측 이득 파라미터를 발생시키는 단계를 더 포함한다. 본 방법은 고-대역 미드 신호 및 고-대역 사이드 신호에 기초하여 제 2 채널간 예측 이득 파라미터를 발생시키는 단계를 더 포함한다. 본 방법은 또한 제 2 채널간 예측 이득 파라미터를 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호와 함께 제 2 디바이스로 전송하는 단계를 포함한다.
본 방법은 미드 신호 및 사이드 신호에 기초하여 상관 파라미터를 발생시키는 단계를 포함한다. 방법은 또한 상관 파라미터를 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호와 함께, 제 2 디바이스로 전송하는 단계를 포함한다. 특정의 구현예에서, 채널간 예측 이득 파라미터는 사이드 신호의 에너지 레벨과 미드 신호의 에너지 레벨의 비에 기초한다. 특정의 구현예에서, 상관 파라미터는 미드 신호의 에너지 레벨과, 미드 신호와 사이드 신호의 내적의 비에 기초한다.
특정의 양태에서, 디바이스는 인코더 및 송신기를 포함한다. 인코더는 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키도록 구성된다. 인코더는 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키도록 구성된다. 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하도록 추가로 구성된다. 인코더는 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하도록 구성된다. 인코더는 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키도록 구성된다. 송신기는 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들을 송신하도록 구성된다.
특정의 구현예에서, 인코더는 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 제 1 값을 가지는 코딩 또는 예측 파라미터를 발생시키도록 추가로 구성된다. 송신기는 코딩 또는 예측 파라미터를 송신하도록 구성된다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 샘플들과 제 2 오디오 신호의 제 1 특정의 샘플들 사이의 시간 부정합의 양을 표시하는 시간 부정합 값을 결정하도록 추가로 구성된다. 인코더는 또한 시간 부정합 값이 부정합 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 구성된다. 특정의 구현예에서, 인코더는 시간 부정합 값과 제 2 시간 부정합 값의 비교에 기초하여, 시간 부정합 안정성 표시자를 결정하도록 추가로 구성된다. 제 2 시간 부정합 값은 적어도 부분적으로 제 1 오디오 신호의 제 2 샘플들에 기초한다. 인코더는 또한 시간 부정합 안정성 표시자가 시간 부정합 안정성 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 구성된다. 복수의 파라미터들은 시간 부정합 안정성 표시자를 포함한다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 샘플들의 제 1 에너지와 제 2 오디오 신호의 제 1 특정의 샘플들의 제 1 특정의 에너지의 에너지 비에 대응하는 채널간 이득 파라미터를 결정하도록 추가로 구성된다. 인코더는 또한 채널간 이득 파라미터가 채널간 이득 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 구성된다. 복수의 파라미터들은 채널간 이득 파라미터를 포함한다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 샘플들의 제 1 에너지와 제 2 오디오 신호의 제 1 특정의 샘플들의 제 1 특정의 에너지의 에너지 비에 대응하는 채널간 이득 파라미터를 결정하도록 추가로 구성된다. 인코더는 또한 채널간 이득 파라미터 및 제 2 채널간 이득 파라미터에 기초하여, 평활화된 채널간 이득 파라미터를 결정하도록 구성된다. 제 2 채널간 이득 파라미터는 제 1 오디오 신호의 제 2 샘플들의 제 2 에너지에 적어도 부분적으로 기초한다. 인코더는 평활화된 채널간 이득 파라미터가 평활화된 채널간 이득 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 추가로 구성된다. 복수의 파라미터들은 평활화된 채널간 이득 파라미터를 포함한다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 샘플들의 제 1 에너지와 제 2 오디오 신호의 제 1 특정의 샘플들의 제 1 특정의 에너지의 에너지 비에 대응하는 채널간 이득 파라미터를 결정하도록 추가로 구성된다. 인코더는 또한 채널간 이득 파라미터 및 제 2 채널간 이득 파라미터에 기초하여, 평활화된 채널간 이득 파라미터를 결정하도록 구성된다. 제 2 채널간 이득 파라미터는 제 1 오디오 신호의 제 2 샘플들의 제 2 에너지에 적어도 부분적으로 기초한다. 인코더는 채널간 이득 파라미터와 평활화된 채널간 이득 파라미터의 비교에 기초하여, 채널간 이득 신뢰성 표시자를 결정하도록 추가로 구성된다. 인코더는 또한 채널간 이득 신뢰성 표시자가 채널간 이득 신뢰성 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 구성된다. 복수의 파라미터들은 채널간 이득 신뢰성 표시자를 포함한다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 샘플들의 제 1 에너지와 제 2 오디오 신호의 제 1 특정의 샘플들의 제 1 특정의 에너지의 에너지 비에 대응하는 채널간 이득 파라미터를 결정하도록 추가로 구성된다. 인코더는 또한 채널간 이득 파라미터와 제 2 채널간 이득 파라미터의 비교에 기초하여 채널간 이득 안정성 표시자를 결정하도록 구성된다. 제 2 채널간 이득 파라미터는 제 1 오디오 신호의 제 2 샘플들의 제 2 에너지에 적어도 부분적으로 기초한다. 인코더는 채널간 이득 안정성 표시자가 채널간 이득 안정성 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 추가로 구성된다. 복수의 파라미터들은 채널간 이득 안정성 표시자를 포함한다. 특정의 구현예에서, 복수의 파라미터들은 음성 결정 파라미터, 코어 유형, 또는 과도 표시자 중 적어도 하나를 포함한다.
특정의 구현예에서, 인코더는 사이드 신호의 에너지, 미드 신호의 에너지, 또는 양자에 기초하여, 채널간 예측 이득 값을 결정하도록 추가로 구성된다. 인코더는 또한 채널간 예측 이득 값이 채널간 예측 이득 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 구성된다. 복수의 파라미터들은 채널간 예측 이득 값을 포함한다.
특정의 구현예에서, 인코더는 인코딩된 미드 신호에 기초하여, 합성된 미드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 사이드 신호의 에너지 및 합성된 미드 신호의 에너지에 기초하여 채널간 예측 이득 값을 결정하도록 구성된다. 인코더는 채널간 예측 이득 값이 채널간 예측 이득 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하도록 추가로 구성된다. 복수의 파라미터들은 채널간 예측 이득 값을 포함한다.
특정의 구현예에서, 인코더는 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 인코딩된 사이드 신호에 기초하여, 합성된 사이드 신호를 발생시키도록 구성된다. 인코더는 사이드 신호의 에너지 및 합성된 사이드 신호의 에너지에 기초하여 채널간 예측 이득 값을 결정하도록 추가로 구성된다. 인코더는 또한 채널간 예측 이득 값이 채널간 예측 이득 임계치를 만족시킨다고 결정하는 것에 기초하여, 사이드 신호가 인코딩되어야 한다고 결정하도록 구성된다. 복수의 파라미터들은 채널간 예측 이득 값을 포함한다.
특정의 구현예에서, 인코더, 송신기, 및 안테나는 모바일 디바이스에 통합된다. 특정의 구현예에서, 인코더, 송신기, 및 안테나는 기지국 디바이스에 통합된다.
특정의 양태에서, 방법은 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 또한 디바이스에서, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 단계를 더 포함한다. 본 방법은 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 단계를 포함한다. 본 방법은 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 더 포함한다. 본 방법은 또한 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스로부터, 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들의 송신을 개시하는 단계를 더 포함한다.
특정의 구현예에서, 본 방법은 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 표시하는 코딩 또는 예측 파라미터를 발생시키는 단계를 포함한다. 본 방법은 또한 디바이스로부터 코딩 또는 예측 파라미터를 송신하는 단계를 포함한다.
특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는, 프로세서에 의해 실행될 때, 프로세서로 하여금, 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 미드 신호를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 동작들은 또한 제 1 오디오 신호 및 제 2 오디오 신호에 기초하여 사이드 신호를 발생시키는 것을 포함한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 또는 양자에 기초하여 복수의 파라미터들을 결정하는 것을 더 포함한다. 동작들은 또한 복수의 파라미터들에 기초하여, 사이드 신호가 송신을 위해 인코딩되어야 하는지 여부를 결정하는 것을 포함한다. 동작들은 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되어야 한다고 결정하는 것에 응답하여 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 것을 포함한다. 동작들은 인코딩된 미드 신호, 인코딩된 사이드 신호, 또는 양자에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
특정의 구현예에서, 복수의 파라미터들은 시간 부정합 값, 시간 부정합 안정성 표시자, 채널간 이득 파라미터, 평활화된 채널간 이득 파라미터, 채널간 이득 신뢰성 표시자, 채널간 이득 안정성 표시자, 음성 결정 파라미터, 코어 유형, 과도 표시자, 또는 채널간 예측 이득 값 중 적어도 하나를 포함한다.
특정의 양태에서, 디바이스는 인코더 및 송신기를 포함한다. 인코더는 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여 제 1 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 인코더는 또한 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키도록 추가로 구성된다. 인코더는 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키도록 구성된다. 송신기는 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들을 송신하도록 구성된다.
특정의 구현예에서, 인코더는 제 1 오디오 신호의 제 1 에너지를 결정하고, 제 2 오디오 신호의 제 2 에너지를 결정하고, 그리고 제 1 에너지와 제 2 에너지의 비교에 기초하여 제 1 값을 결정하도록 구성된다. 특정의 구현예에서, 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 사이드 신호를 발생시키도록 구성된다. 인코더는 또한 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키도록 구성된다. 비트스트림 파라미터들은 또한 인코딩된 사이드 신호에 대응한다.
특정의 구현예에서, 인코더는 기준이 만족될 때 추가로 조절된 제 2 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다. 인코더는 기준이 만족되지 않을 때 추가로 조절된 제 1 값을 갖는 다운믹스 파라미터를 발생시키도록 구성된다.
특정의 구현예에서, 인코더는 제 1 오디오 신호, 제 2 오디오 신호, 및 제 1 값에 기초하여 제 1 사이드 신호를 발생시키도록 구성된다. 인코더는 또한 제 1 오디오 신호, 제 2 오디오 신호, 및 제 2 값에 기초하여 제 2 사이드 신호를 발생시키도록 구성된다. 인코더는 제 1 사이드 신호의 제 1 에너지와 제 2 사이드 신호의 제 2 에너지의 비교에 기초하여 에너지 비교 값을 결정하도록 추가로 구성된다. 인코더는 또한 에너지 비교 값이 에너지 임계치를 만족시킨다고 결정하는 것에 응답하여, 기준이 만족된다고 결정하도록 구성된다.
특정의 구현예에서, 인코더는 시간 부정합 값에 기초하여, 제 1 오디오 신호의 제 1 샘플들 및 제 2 오디오 신호의 제 2 샘플들을 선택하도록 구성된다. 시간 부정합 값은 제 1 오디오 신호와 제 2 오디오 신호 사이의 시간 부정합의 양을 표시한다. 인코더는 또한 제 1 샘플들과 제 2 샘플들의 비교에 기초하여 교차-상관 값을 결정하도록 구성된다. 인코더는 교차-상관 값이 교차-상관 임계치를 만족시킨다고 결정하는 것에 응답하여, 기준이 만족된다고 결정하도록 추가로 구성된다.
특정의 구현예에서, 인코더는 시간 부정합 값이 부정합 임계치를 만족시킨다고 결정하는 것에 응답하여, 기준이 만족된다고 결정하도록 구성된다. 특정의 구현예에서, 인코더는 코더 유형, 코어 유형, 또는 음성 결정 파라미터 중 적어도 하나에 기초하여, 기준이 만족되는지 여부를 결정하도록 구성된다.
특정의 구현예에서, 송신기는 제 1 값을 송신하도록 구성된다. 특정의 구현예에서, 송신기는 다운믹스 파라미터를 송신하도록 구성된다. 예를 들어, 송신기는 다운믹스 파라미터의 값이 디폴트 다운믹스 파라미터 값과 상이하고 결정하는 것에 응답하여, 다운믹스 파라미터를 송신하도록 구성된다. 다른 예로서, 송신기는 다운믹스 파라미터가 디코더에서 이용불가능한 하나 이상의 파라미터들에 기초한다고 결정하는 것에 응답하여, 다운믹스 파라미터를 송신하도록 구성된다.
특정의 구현예에서, 인코더는 보이싱 인자에 기초하여 제 2 값을 결정하도록 구성된다. 특정의 구현예에서, 인코더는 시간 부정합 값에 기초하여, 제 1 오디오 신호의 제 1 샘플들 및 제 2 오디오 신호의 제 2 샘플들을 선택하도록 구성된다. 시간 부정합 값은 제 1 오디오 신호와 제 2 오디오 신호 사이의 시간 부정합의 양을 표시한다. 인코더는 또한 제 1 샘플들과 제 2 샘플들의 비교에 기초하여 교차-상관 값을 결정하도록 구성된다. 제 2 값은 교차-상관 값에 기초한다.
특정의 구현예에서, 디바이스는 송신기 에 커플링된 안테나를 포함한다. 특정의 구현예에서, 안테나, 인코더, 및 송신기는 모바일 디바이스에 통합된다. 특정의 구현예에서, 안테나, 인코더, 및 송신기는 기지국에 통합된다.
특정의 양태에서, 방법은 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여, 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 본 방법은 또한 디바이스에서, 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 단계를 포함한다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 본 방법은 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 단계를 더 포함한다. 본 방법은 또한 디바이스에서, 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 단계를 포함한다. 본 방법은 디바이스로부터, 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들의 송신을 개시하는 단계를 더 포함한다.
특정의 구현예에서, 본 방법은 디바이스에서, 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 사이드 신호를 발생시키는 단계를 포함한다. 본 방법은 또한 디바이스에서, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여, 사이드 신호에 대응하는 인코딩된 사이드 신호를 발생시키는 단계를 포함한다. 비트스트림 파라미터들은 또한 인코딩된 사이드 신호에 대응한다.
특정의 양태에서, 컴퓨터-판독가능 저장 디바이스는, 프로세서에 의해 실행될 때, 프로세서로 하여금, 사이드 신호가 송신을 위해 인코딩되어야 하는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 응답하여 제 1 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장한다. 제 1 값은 에너지 메트릭, 상관 메트릭, 또는 양자에 기초한다. 에너지 메트릭, 상관 메트릭, 또는 양자는 제 1 오디오 신호 및 제 2 오디오 신호에 기초한다. 동작들은 또한 사이드 신호가 송신을 위해 인코딩되지 않는 것으로 코딩 또는 예측 파라미터가 표시한다고 결정하는 것에 적어도 부분적으로 기초하여 제 2 값을 갖는 다운믹스 파라미터를 발생시키는 것을 포함한다. 제 2 값은 디폴트 다운믹스 파라미터 값, 제 1 값, 또는 양자에 기초한다. 동작들은 제 1 오디오 신호, 제 2 오디오 신호, 및 다운믹스 파라미터에 기초하여 미드 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 미드 신호에 대응하는 인코딩된 미드 신호를 발생시키는 것을 포함한다. 동작들은 적어도 인코딩된 미드 신호에 대응하는 비트스트림 파라미터들의 송신을 개시하는 것을 더 포함한다.
특정의 구현예에서, 동작들은 시간 부정합 값, 코더 유형, 코어 유형, 또는 음성 결정 파라미터 중 적어도 하나에 기초하여, 기준이 만족되는지 여부를 결정하는 것을 포함한다. 다운믹스 파라미터는 기준이 만족될 때 추가로 조절되는 제 2 값을 갖는다.
당업자들은 또한 본원에서 개시한 양태들과 관련하여 설명된 다양한 예시적인 로직 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 하드웨어 프로세서와 같은 프로세싱 디바이스에 의해 실행되는 컴퓨터 소프트웨어, 또는 양자의 조합들로서 구현될 수도 있음을 알 수 있을 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들, 및 단계들이 일반적으로 그들의 기능의 관점에서 위에서 설명되었다. 이러한 기능이 하드웨어 또는 실행가능한 소프트웨어로서 구현되는지 여부는 특정의 애플리케이션 및 전체 시스템에 가해지는 설계 제약들에 의존한다. 당업자들은 각각의 특정의 애플리케이션 마다 설명한 기능을 다양한 방법으로 구현할 수도 있으며, 그러나 이런 구현 결정들은 본 개시물의 범위로부터의 일탈을 초래하는 것으로 해석되어서는 안된다.
본원에서 개시한 양태들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로, 프로세서에 의해 실행되는 소프트웨어 모듈로, 또는 이 둘의 조합으로 직접 구현될 수도 있다. 소프트웨어 모듈은 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 전송 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈식 디스크, 또는 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은, 메모리 디바이스에 상주할 수도 있다. 예시적인 메모리 디바이스는 프로세서가 메모리 디바이스로부터 정보를 판독하고 그에 정보를 기록할 수 있도록 프로세서에 커플링된다. 대안적으로는, 메모리 디바이스는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 주문형 집적 회로 (ASIC) 에 상주할 수도 있다. ASIC 는 컴퓨팅 디바이스 및 사용자 터미널에 상주할 수도 있다. 대안적으로는, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에서 별개의 컴포넌트들로서 상주할 수도 있다.
개시된 양태들의 이전 설명은 당업자로 하여금 개시된 양태들을 실시하거나 또는 이용할 수 있도록 하기 위해서 제공된다. 이들 양태들에 대한 여러 변경들은 당업자들에게 명백할 것이며, 본원에서 정의된 원리들은 본 개시물의 범위로부터 일탈함이 없이 다른 양태들에 적용될 수도 있다. 따라서, 본 개시물은 본원에서 나타낸 양태들에 한정하려는 것이 아니라, 다음 청구항들에 의해 정의되는 바와 같은 원리들 및 신규한 특징들과 가능한 한 부합하는 최광의의 범위를 부여하려는 것이다.

Claims (30)

  1. 디바이스로서,
    채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하도록 구성된 수신기로서, 상기 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함하는, 상기 수신기; 및
    디코더를 포함하며,
    상기 디코더는,
    상기 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키고;
    상기 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키고; 그리고
    상기 중간 합성된 사이드 신호를 필터링하여 합성된 사이드 신호를 발생시키도록 구성되는, 디바이스.
  2. 제 1 항에 있어서,
    상기 디코더는 상기 중간 합성된 사이드 신호를 필터링하여 상기 합성된 사이드 신호를 발생시키도록 구성된 위상 분산 필터를 포함하는, 디바이스.
  3. 제 2 항에 있어서,
    상기 위상 분산 필터는 하나 이상의 정지된 비상관 필터들, 하나 이상의 비-정지된 비상관 필터들, 또는 이들의 조합을 포함하는, 디바이스.
  4. 제 2 항에 있어서,
    상기 위상 분산 필터는 하나 이상의 비선형 전역-통과 리샘플링 필터들을 포함하는, 디바이스.
  5. 제 1 항에 있어서,
    상기 디코더는 상기 합성된 미드 신호에 대해 디-엠퍼시스 필터링을 수행하도록 구성된 디-엠퍼시스 필터를 더 포함하는, 디바이스.
  6. 제 1 항에 있어서,
    상기 디코더는 상기 합성된 미드 신호 및 상기 합성된 사이드 신호를 업샘플링하도록 구성된 업샘플러를 더 포함하는, 디바이스.
  7. 제 1 항에 있어서,
    상기 디코더는 상기 합성된 사이드 신호의 제 1 프레임과 제 2 합성된 사이드 신호의 제 2 프레임 사이의 불연속성을 감소시키도록 구성된 불연속성 억제기를 더 포함하며,
    상기 제 2 합성된 사이드 신호는 상기 수신기에서 수신된 인코딩된 사이드 신호에 기초하여 발생되는, 디바이스.
  8. 제 7 항에 있어서,
    상기 불연속성 억제기는 상기 제 2 합성된 사이드 신호의 하나 이상의 프레임들을 상기 합성된 사이드 신호의 하나 이상의 프레임들과 교차-페이딩하도록 구성되는, 디바이스.
  9. 제 7 항에 있어서,
    상기 불연속성 억제기는,
    상기 제 2 합성된 사이드 신호의 미러링된 샘플들을 발생시키고; 그리고
    상기 미러링된 샘플들을 하나 이상의 프레임들에 대한 상기 합성된 사이드 신호와 교차-페이딩하도록 구성되는, 디바이스.
  10. 제 7 항에 있어서,
    상기 불연속성 억제기는 하나 이상의 프레임들에 대한 상기 제 2 합성된 사이드 신호의 발생을 연기하도록 구성되는, 디바이스.
  11. 제 1 항에 있어서,
    상기 디코더 및 상기 수신기는 모바일 디바이스에 통합되는, 디바이스.
  12. 제 1 항에 있어서,
    상기 디코더 및 상기 수신기는 기지국에 통합되는, 디바이스.
  13. 통신의 방법으로서,
    제 1 디바이스에서 제 2 디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 단계로서, 상기 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함하는, 상기 수신하는 단계;
    상기 제 1 디바이스에서, 상기 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 단계;
    상기 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 단계; 및
    합성된 사이드 신호를 발생시키기 위해 상기 중간 합성된 사이드 신호를 필터링하는 단계를 포함하는, 통신의 방법.
  14. 제 13 항에 있어서,
    상기 합성된 사이드 신호의 제 1 프레임과 제 2 합성된 사이드 신호의 제 2 프레임 사이의 불연속성을 감소시키는 단계를 더 포함하며,
    상기 제 2 합성된 사이드 신호는 인코딩된 사이드 신호에 기초하여 발생되며, 상기 인코딩된 오디오 신호는 상기 인코딩된 사이드 신호를 포함하는, 통신의 방법.
  15. 제 13 항에 있어서,
    상기 합성된 사이드 신호의 하나 이상의 프레임들을 제 2 합성된 사이드 신호의 하나 이상의 프레임들과 교차-페이딩하는 단계를 더 포함하는, 통신의 방법.
  16. 제 13 항에 있어서,
    제 2 합성된 사이드 신호의 미러링된 샘플들을 발생시키는 단계; 및
    상기 미러링된 샘플들을 하나 이상의 프레임들에 대한 상기 합성된 사이드 신호와 크로스-페이딩시키는 단계를 더 포함하는, 통신의 방법.
  17. 제 13 항에 있어서,
    상기 채널간 예측 이득 파라미터에 기초하여 전역-통과 필터의 적어도 하나의 파라미터의 값을 설정하는 단계를 더 포함하며,
    상기 필터링하는 단계는 상기 전역-통과 필터에 의해 수행되며, 상기 적어도 하나의 파라미터는 지연 파라미터, 이득 파라미터, 또는 양자를 포함하는, 통신의 방법.
  18. 제 13 항에 있어서,
    상기 제 1 디바이스에서 상기 제 2 디바이스로부터 코딩 모드 파라미터를 수신하는 단계; 및
    음악 코딩 모드를 표시하는 상기 코딩 모드 파라미터에 기초하여 전역-통과 필터의 다수의 스테이지들의 각각을 인에이블링하는 단계를 더 포함하며,
    상기 필터링하는 단계는 상기 전역-통과 필터에 의해 수행되는, 통신의 방법.
  19. 제 18 항에 있어서,
    음성 코딩 모드를 표시하는 코딩 모드 파라미터에 기초하여 상기 전역-통과 필터의 적어도 하나의 스테이지를 디스에이블링하는 단계를 더 포함하는, 통신의 방법.
  20. 제 13 항에 있어서,
    상기 제 1 디바이스에서 상기 제 2 디바이스로부터 제 2 채널간 예측 이득 파라미터를 수신하는 단계; 및
    저-대역 합성된 미드 신호 및 고-대역 합성된 미드 신호를 발생시키기 위해 상기 합성된 미드 신호를 프로세싱하는 단계를 더 포함하는, 통신의 방법.
  21. 제 20 항에 있어서,
    상기 중간 합성된 사이드 신호를 발생시키는 단계는,
    상기 저-대역 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 저-대역 중간 합성된 사이드 신호를 발생시키는 단계; 및
    상기 고-대역 합성된 미드 신호 및 상기 제 2 채널간 예측 이득 파라미터에 기초하여 고-대역 중간 합성된 사이드 신호를 발생시키는 단계를 포함하는, 통신의 방법.
  22. 제 21 항에 있어서,
    상기 합성된 사이드 신호를 발생시키는 단계는,
    제 1 합성된 사이드 신호를 발생시키기 위해 전역-통과 필터를 이용하여 상기 저-대역 중간 합성된 사이드 신호를 필터링하는 단계;
    상기 전역-통과 필터의 다수의 스테이지들 중 적어도 하나의 스테이지의 적어도 하나의 파라미터를 조정하는 단계;
    제 2 합성된 사이드 신호를 발생시키기 위해 상기 전역-통과 필터를 이용하여 상기 고-대역 중간 합성된 사이드 신호를 필터링하는 단계; 및
    상기 합성된 사이드 신호를 발생시키기 위해 상기 제 1 합성된 사이드 신호와 상기 제 2 합성된 사이드 신호를 결합하는 단계를 포함하는, 통신의 방법.
  23. 제 13 항에 있어서,
    상기 제 1 디바이스는 모바일 디바이스를 포함하는, 통신의 방법.
  24. 제 13 항에 있어서,
    상기 제 1 디바이스는 기지국을 포함하는, 통신의 방법.
  25. 프로세서에 의해 실행될 때, 상기 프로세서로 하여금, 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터-판독가능 저장 디바이스로서,
    상기 동작들은,
    디바이스로부터 채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 것으로서, 상기 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함하는, 상기 수신하는 것;
    상기 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 것;
    상기 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 것; 및
    합성된 사이드 신호를 발생시키기 위해 상기 중간 합성된 사이드 신호를 필터링하는 것을 포함하는, 컴퓨터-판독가능 저장 디바이스.
  26. 제 25 항에 있어서,
    상기 필터링하는 것은 전역-통과 필터에 의해 수행되며, 상기 전역-통과 필터를 이용하여 상기 중간 합성된 사이드 신호를 필터링하는 것은 필터링된 중간 합성된 사이드 신호를 발생시키는, 컴퓨터-판독가능 저장 디바이스.
  27. 제 26 항에 있어서,
    상기 동작들은,
    상기 디바이스로부터 상관 파라미터를 수신하는 것; 및
    상기 합성된 사이드 신호를 발생시키기 위해, 상기 상관 파라미터에 기초하여, 상기 중간 합성된 사이드 신호를 상기 필터링된 중간 합성된 사이드 신호와 믹싱하는 것을 더 포함하는, 컴퓨터-판독가능 저장 디바이스.
  28. 제 27 항에 있어서,
    상기 중간 합성된 사이드 신호와 믹싱되는 상기 필터링된 중간 합성된 사이드 신호의 양은 상기 상관 파라미터에서의 감소에 기초하여 증가되는, 컴퓨터-판독가능 저장 디바이스.
  29. 장치로서,
    채널간 예측 이득 파라미터 및 인코딩된 오디오 신호를 수신하는 수단으로서, 상기 인코딩된 오디오 신호는 인코딩된 미드 신호를 포함하는, 상기 수신하는 수단;
    상기 인코딩된 미드 신호에 기초하여 합성된 미드 신호를 발생시키는 수단;
    상기 합성된 미드 신호 및 상기 채널간 예측 이득 파라미터에 기초하여 중간 합성된 사이드 신호를 발생시키는 수단; 및
    합성된 사이드 신호를 발생시키기 위해 상기 중간 합성된 사이드 신호를 필터링하는 수단을 포함하는, 장치.
  30. 제 29 항에 있어서,
    상기 채널간 예측 이득 파라미터를 수신하는 수단, 상기 합성된 미드 신호를 발생시키는 수단, 상기 중간 합성된 사이드 신호를 발생시키는 수단, 및 상기 중간 합성된 사이드 신호를 필터링하는 수단은 모바일 폰, 기지국, 통신 디바이스, 컴퓨터, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 네비게이션 디바이스, 개인 휴대정보 단말기 (PDA), 디코더, 또는 셋 탑 박스 중 적어도 하나에 통합되는, 장치.
KR1020207009075A 2017-10-05 2018-10-01 오디오 신호들의 디코딩 KR102208842B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762568719P 2017-10-05 2017-10-05
US62/568,719 2017-10-05
US16/147,208 US10580420B2 (en) 2017-10-05 2018-09-28 Encoding or decoding of audio signals
US16/147,208 2018-09-28
PCT/US2018/053799 WO2019070605A1 (en) 2017-10-05 2018-10-01 DECODING AUDIO SIGNALS

Publications (2)

Publication Number Publication Date
KR20200040888A true KR20200040888A (ko) 2020-04-20
KR102208842B1 KR102208842B1 (ko) 2021-01-27

Family

ID=65993423

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207009075A KR102208842B1 (ko) 2017-10-05 2018-10-01 오디오 신호들의 디코딩

Country Status (9)

Country Link
US (1) US10580420B2 (ko)
EP (1) EP3692528B1 (ko)
KR (1) KR102208842B1 (ko)
CN (1) CN111149156B (ko)
AU (1) AU2018345331B2 (ko)
BR (1) BR112020006776A2 (ko)
SG (1) SG11202001641VA (ko)
TW (1) TWI725343B (ko)
WO (1) WO2019070605A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120006010A (ko) * 2009-03-17 2012-01-17 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
KR20130014561A (ko) * 2010-04-09 2013-02-07 돌비 인터네셔널 에이비 복소 예측을 이용한 다중 채널 오디오 신호를 처리하기 위한 오디오 인코더, 오디오 디코더, 및 관련 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA06011396A (es) * 2004-04-05 2006-12-20 Koninkl Philips Electronics Nv Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos.
MX2007005261A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1810279B1 (en) 2004-11-04 2013-12-11 Koninklijke Philips N.V. Encoding and decoding of multi-channel audio signals
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2013045693A2 (en) 2011-09-29 2013-04-04 Dolby International Ab High quality detection in fm stereo radio signals
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
WO2016007528A1 (en) 2014-07-10 2016-01-14 Analog Devices Global Low-complexity voice activity detection
US10157621B2 (en) 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120006010A (ko) * 2009-03-17 2012-01-17 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
KR20130014561A (ko) * 2010-04-09 2013-02-07 돌비 인터네셔널 에이비 복소 예측을 이용한 다중 채널 오디오 신호를 처리하기 위한 오디오 인코더, 오디오 디코더, 및 관련 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20.* *

Also Published As

Publication number Publication date
US20190108846A1 (en) 2019-04-11
EP3692528A1 (en) 2020-08-12
TW201923741A (zh) 2019-06-16
EP3692528C0 (en) 2023-12-06
KR102208842B1 (ko) 2021-01-27
US10580420B2 (en) 2020-03-03
CN111149156B (zh) 2021-03-19
TWI725343B (zh) 2021-04-21
SG11202001641VA (en) 2020-04-29
BR112020006776A2 (pt) 2020-10-06
CN111149156A (zh) 2020-05-12
AU2018345331B2 (en) 2021-01-21
EP3692528B1 (en) 2023-12-06
AU2018345331A1 (en) 2020-03-19
WO2019070605A1 (en) 2019-04-11

Similar Documents

Publication Publication Date Title
EP3692525B1 (en) Decoding of audio signals
US11430452B2 (en) Encoding or decoding of audio signals
US10891961B2 (en) Encoding of multiple audio signals
EP3692527B1 (en) Decoding of audio signals
EP3646321B1 (en) High-band residual prediction with time-domain inter-channel bandwidth extension
KR102208842B1 (ko) 오디오 신호들의 디코딩
KR102208602B1 (ko) 채널간 대역폭 확장

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant