KR20190129084A - 목표 샘플 발생 - Google Patents

목표 샘플 발생 Download PDF

Info

Publication number
KR20190129084A
KR20190129084A KR1020197030037A KR20197030037A KR20190129084A KR 20190129084 A KR20190129084 A KR 20190129084A KR 1020197030037 A KR1020197030037 A KR 1020197030037A KR 20197030037 A KR20197030037 A KR 20197030037A KR 20190129084 A KR20190129084 A KR 20190129084A
Authority
KR
South Korea
Prior art keywords
signal
channel
samples
target
value
Prior art date
Application number
KR1020197030037A
Other languages
English (en)
Other versions
KR102551431B1 (ko
Inventor
벤카트라만 아티
벤카타 수브라마니암 찬드라 세카르 체비얌
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20190129084A publication Critical patent/KR20190129084A/ko
Application granted granted Critical
Publication of KR102551431B1 publication Critical patent/KR102551431B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

오디오 채널들을 인코딩하는 방법은 인코더에서 2개 이상의 채널들을 수신하는 단계 및 목표 채널 및 참조 채널을 식별하는 단계를 포함한다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 본 방법은 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 단계를 포함한다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 본 방법은 또한 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 단계를 포함한다. 본 방법은 또한 시간 상관 값을 임계치와 비교하는 단계를 포함한다. 본 방법은 비교, 코더 유형, 또는 양자에 기초하여 손실된 목표 샘플들을 발생시키는 단계를 더 포함한다.

Description

목표 샘플 발생
I. 우선권의 주장
본 출원은 "TARGET SAMPLE GENERATION" 이란 발명의 명칭으로 2017년 3월 20일에 출원된 동일인 소유의 미국 가특허 출원번호 제 62/474,010호, 및 "TARGET SAMPLE GENERATION" 이란 발명의 명칭으로 2018년 2월 8일에 출원된 미국 정규 출원번호 제 15/892,130호로부터 우선권의 이익을 주장하며, 전술한 출원들 각각의 내용이 본원에서 그들 전체로 참조로 명시적으로 포함된다.
II. 분야
본 개시물은 일반적으로 다수의 오디오 신호들의 인코딩하는 것에 관한 것이다.
III. 관련 기술의 설명
기술의 진보는 더 작고 더 강력한 컴퓨팅 디바이스들을 초래하였다. 예를 들어, 작고, 가벼우며, 사용자들이 쉽게 휴대하는 무선 전화기들, 이를 테면 모바일 및 스마트폰들, 태블릿들 및 랩탑 컴퓨터들을 포함한, 다양한 휴대형 개인 컴퓨팅 디바이스들이 현재 존재한다. 이들 디바이스들은 무선 네트워크들을 통해서 보이스 및 데이터 패킷들을 통신할 수 있다. 또, 다수의 이러한 디바이스들은 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 리코더, 및 오디오 파일 플레이어와 같은, 추가적인 기능을 포함한다. 또한, 이러한 디바이스들은 인터넷에 액세스하는데 사용될 수 있는, 웹 브라우저 애플리케이션과 같은, 소프트웨어 애플리케이션들을 포함한, 실행가능한 명령들을 프로세싱할 수 있다. 이와 같이, 이들 디바이스들은 상당한 컴퓨팅 능력들을 포함할 수 있다.
컴퓨팅 디바이스는 오디오 신호들을 수신하기 위한 다수의 마이크로폰들을 포함할 수도 있다. 일반적으로, 사운드 소스는 다수의 마이크로폰들 중 제 2 마이크로폰보다 제 1 마이크로폰에 더 가깝다. 따라서, 제 2 마이크로폰으로부터 수신된 제 2 오디오 신호는 사운드 소스로부터의 마이크로폰들의 거리의 인해 제 1 마이크로폰으로부터 수신된 제 1 오디오 신호에 대해 지연될 수도 있다. 스테레오-인코딩에서, 마이크로폰들로부터의 오디오 신호들은 중간 (mid) 채널 신호 및 하나 이상의 사이드 (side) 채널 신호들을 발생시키기 위해 인코딩될 수도 있다. 중간 채널 신호는 제 1 오디오 신호와 제 2 오디오 신호의 합에 대응할 수도 있다. 사이드 채널 신호는 제 1 오디오 신호와 제 2 오디오 신호 사이의 차이에 대응할 수도 있다. 제 1 오디오 신호는 제 1 오디오 신호에 대한, 제 2 오디오 신호를 수신할 때의 지연 때문에, 제 2 오디오 신호와 정렬되지 않을 수도 있다. 제 2 오디오 신호에 대한 제 1 오디오 신호의 오정렬은 2개의 오디오 신호들 사이의 차이를 증가시킬 수도 있다. 차이의 증가 때문에, 더 높은 비트수가 사이드 채널 신호를 인코딩하는데 사용될 수도 있다.
특정의 구현예에서, 인코더는 2개 이상의 채널들을 수신하고 목표 채널 및 참조 채널을 식별하도록 구성된다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 인코더는 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써, 수정된 목표 채널을 발생시키도록 구성된다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 인코더는 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하도록 추가로 구성된다. 인코더는 시간 상관 값을 임계치와 비교하도록 추가로 구성된다. 인코더는 또한 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플 (missing target sample) 들을 발생시키도록 구성된다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다.
다른 특정의 구현예에서, 오디오 채널들을 인코딩하는 방법은 인코더에서 2개 이상의 채널들을 수신하는 단계 및 목표 채널 및 참조 채널을 식별하는 단계를 포함한다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 본 방법은 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 단계를 포함한다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 본 방법은 또한 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 단계를 포함한다. 본 방법은 또한 시간 상관 값을 임계치와 비교하는 단계를 포함한다. 본 방법은 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 단계를 더 포함한다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다.
다른 특정의 구현예에서, 비일시적 컴퓨터 판독가능 매체는 인코더 내 프로세서에 의해 실행될 때, 인코더로 하여금, 목표 채널 및 참조 채널을 식별하는 것을 포함하는 동작들을 수행가능하게 하는 명령들을 포함한다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 동작들은 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 것을 포함한다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 동작들은 또한 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 것을 포함한다. 동작들은 또한 시간 상관 값을 임계치와 비교하는 것을 포함한다. 동작들은 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 것을 더 포함한다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다.
다른 특정의 구현예에서, 디바이스는 목표 채널 및 참조 채널을 식별하는 수단을 포함한다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 디바이스는 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 수단을 포함한다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 디바이스는 또한 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 수단을 포함한다. 디바이스는 또한 시간 상관 값을 임계치와 비교하는 수단을 포함한다. 디바이스는 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 수단을 더 포함한다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다.
본 개시물의 다른 양태들, 이점들, 및 특징들은 다음 섹션들: 도면들의 간단한 설명, 상세한 설명, 및 청구항들을 포함한, 출원서의 검토 후 명백해질 것이다.
도 1 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 디바이스를 포함하는 시스템의 특정의 예시적인 예의 블록도이다.
도 2 는 도 1 의 디바이스를 포함하는 시스템의 다른 예를 예시하는 다이어그램이다.
도 3 은 도 1 의 디바이스에 의해 인코딩될 수도 있는 샘플들의 특정의 예들을 예시하는 다이어그램이다.
도 4 는 도 1 의 디바이스에 의해 인코딩될 수도 있는 샘플들의 특정의 예들을 예시하는 다이어그램이다.
도 5 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 6 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 7 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 8 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 9a 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 9b 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 9c 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 10a 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 10b 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 11 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 12 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 13 은 다수의 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 14 는 도 1 의 디바이스를 포함하는 시스템의 다른 예를 예시하는 다이어그램이다.
도 15 는 도 1 의 디바이스를 포함하는 시스템의 다른 예를 예시하는 다이어그램이다.
도 16 은 다수의 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 17 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 18 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 19 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 20 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 21 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템의 다른 예를 예시하는 다이어그램이다.
도 22 는 다수의 오디오 신호들을 인코딩하는 특정의 방법을 예시하는 플로우 차트이다.
도 23 은 시간적으로 시프트된 목표 채널에 대한 목표 샘플들을 발생시키는 프로세스 다이어그램이다.
도 24 는 시간적으로 시프트된 목표 채널에 대한 목표 샘플들을 발생시키는 특정의 방법을 예시하는 플로우 차트이다.
도 25 는 다수의 오디오 신호들을 인코딩하도록 동작가능한 디바이스의 특정의 예시적인 예의 블록도이다.
도 26 은 다수의 오디오 신호들을 인코딩하도록 동작가능한 기지국의 블록도이다.
본 개시물의 특정의 양태들이 도면들을 참조하여 아래에서 설명된다. 이 설명에서, 공통 특징들은 공통 참조 번호들에 의해 지정된다. 본원에서 사용될 때, 여러 전문용어는 단지 특정의 구현예들을 기술하려는 목적을 위해 사용되며 구현예들을 한정하려고 의도되지 않는다. 예를 들어, 단수형들 "a", "an", 및 "the" 는 문맥에서 달리 분명히 표시하지 않는 한, 복수형들도 또한 포함시키려는 것이다. 또한, 용어들 "포함한다 (comprises)" 및 "포함하는 (comprising)" 이 "구비한다 (includes)" 또는 "구비하는 (including)" 과 상호교환가능하게 사용될 수도 있음을 알 수 있을 것이다. 추가적으로, 용어 "여기서 (wherein)" 가 "d여기에서 (where)" 와 상호교환가능하게 사용될 수도 있음을 알 수 있을 것이다. 본원에서 사용될 때, 구조, 컴포넌트, 동작, 등과 같은 엘리먼트를 한정하는데 사용되는 서수의 용어 (예컨대, "제 1", "제 2", "제 3", 등) 는 다른 엘리먼트에 대해서 그 엘리먼트의 임의의 우선순위 또는 순서를 단독으로 표시하기 보다는, 오히려 그 엘리먼트를 (서수의 용어를 사용하지 않는다면) 동일한 이름을 가지는 다른 엘리먼트와 단순히 식별한다. 본원에서 사용될 때, 용어 "세트" 는 하나 이상의 특정의 엘리먼트를 지칭하며, 용어 "복수" 는 다수의 (예컨대, 2개 이상의) 특정의 엘리먼트를 지칭한다.
본 개시물에서, 용어들 예컨대 "결정하는 것", "계산하는 것", "시프트하는 것", "조정하는 것", 등은 하나 이상의 동작들이 수행되는 방법을 설명하기 위해 사용될 수도 있다. 이러한 용어들이 한정적인 것으로 해석되어서는 안되며 다른 기법들이 유사한 동작들을 수행하는데 이용될 수도 있다는 점에 유의해야 한다. 추가적으로, 본원에서 인용될 때, "발생시키는 것", "계산하는 것", "이용하는 것", "선택하는 것", "액세스하는 것", "식별하는 것", 및 "결정하는 것" 은 교환가능하게 사용될 수도 있다. 예를 들어, 파라미터 (또는, 신호) 를 "발생시키는 것", "계산하는 것", 또는 "결정하는 것" 은 파라미터 (또는, 신호) 를 능동적으로 발생시키는 것, 계산하는 것, 또는 결정하는 것을 지칭할 수도 있거나, 또는 예컨대, 다른 컴포넌트 또는 디바이스에 의해 이미 발생된 파라미터 (또는, 신호) 를 이용하는 것, 선택하는 것, 또는 액세스하는 것을 지칭할 수도 있다.
다수의 오디오 신호들을 인코딩하도록 동작가능한 시스템들 및 디바이스들이 개시된다. 디바이스는 다수의 오디오 신호들을 인코딩하도록 구성된 인코더를 포함할 수도 있다. 다수의 오디오 신호들이 다수의 리코딩 디바이스들, 예컨대, 다수의 마이크로폰들을 이용하여, 시간적으로 동시에 캡쳐될 수도 있다. 일부 예들에서, 다수의 오디오 신호들 (또는, 멀티-채널 오디오) 은 동시에 또는 상이한 시간들에서 기록되는 여러 오디오 채널들을 멀티플렉싱함으로써 합성적으로 (예컨대, 인공적으로) 발생될 수도 있다. 예시적인 예들로서, 오디오 채널들의 병행 리코딩 또는 멀티플렉싱은 2-채널 구성 (즉, 스테레오: 좌측 및 우측), 5.1 채널 구성 (좌측, 우측, 중심, 촤측 서라운드, 우측 서라운드, 및 저주파수 강조 (LFE) 채널들), 7.1 채널 구성, 7.1+4 채널 구성, 22.2 채널 구성, 또는 N-채널 구성을 발생시킬 수도 있다.
원격 화상 회의실들 (또는, 원거리 영상 회의실들) 에서의 오디오 캡쳐 디바이스들은 공간 오디오를 획득하는 다수의 마이크로폰들을 포함할 수도 있다. 공간 오디오는 인코딩되어 송신되는 음성 뿐만 아니라 백그라운드 오디오를 포함할 수도 있다. 주어진 소스 (예컨대, 화자) 로부터의 음성/오디오는, 마이크로폰들이 배열되는 방법 뿐만 아니라, 소스 (예컨대, 화자) 가 마이크로폰들에 대해 로케이트되는 위치 및 방 치수들에 따라서, 다수의 마이크로폰들에 상이한 시간들에서 도달할 수도 있다. 예를 들어, 사운드 소스 (예컨대, 화자) 는 디바이스와 연관된 제 2 마이크로폰 보다 디바이스와 연관된 제 1 마이크로폰에 더 가까울 수도 있다. 따라서, 사운드 소스로부터 방출된 사운드는 제 2 마이크로폰보다 시간적으로 더 빨리 제 1 마이크로폰에 도달할 수도 있다. 디바이스는 제 1 마이크로폰을 통해서 제 1 오디오 신호를 수신할 수도 있으며, 제 2 마이크로폰을 통해서 제 2 오디오 신호를 수신할 수도 있다.
일부 예들에서, 마이크로폰들은 다수의 사운드 소스들로부터 오디오를 수신할 수도 있다. 다수의 사운드 소스들은 지배적인 사운드 소스 (예컨대, 화자) 및 하나 이상의 2차 사운드 소스들 (예컨대, 지나가는 차, 트래픽, 백그라운드 음악, 거리 잡음) 을 포함할 수도 있다. 지배적인 사운드 소스로부터 방출된 사운드는 제 2 마이크로폰보다 시간적으로 더 일찍 제 1 마이크로폰에 도달할 수도 있다.
오디오 신호는 세그먼트들 또는 프레임들로 인코딩될 수도 있다. 프레임은 다수의 샘플들 (예컨대, 640 샘플들, 1920 샘플들 또는 2000 샘플들) 에 대응할 수도 있다. 중간-사이드 (MS) 코딩 및 파라메트릭 스테레오 (PS) 코딩은 이중-모노 코딩 기법들보다 향상된 효율을 제공할 수도 있는 스테레오 코딩 기법들이다. 이중-모노 코딩에서, 좌측 (L) 채널 (또는, 신호) 및 우측 (R) 채널 (또는, 신호) 은 채널간 상관을 이용함이 없이 독립적으로 코딩된다. MS 코딩은 코딩 전에 좌측 채널 및 우측 채널을 합-채널 및 차이-채널 (예컨대, 사이드 채널) 로 변환함으로써, 상관된 L/R 채널-쌍 사이에 리던던시를 감소시킨다. 합 신호 및 차이 신호는 MS 코딩으로 파형 코딩된다. 상대적으로 더 많은 비트들이 사이드 신호보다 합 신호에 소비된다. PS 코딩은 L/R 신호들을 합 신호 및 사이드 파라미터들의 세트로 변환함으로써 각각의 서브밴드에서 리던던시를 감소시킨다. 사이드 파라미터들은 채널간 강도 차이 (IID), 채널간 위상 차이 (IPD), 채널간 시간 차이 (ITD), 등을 표시할 수도 있다. 합 신호는 사이드 파라미터들과 함께 파형 코딩 및 송신된다. 하이브리드 시스템에서, 사이드-채널은, 채널간 위상 보호가 지각적으로 덜 중요한, (예컨대, 2-3 kHz 이상인) 상부 대역들에서 PS 코딩되고 (예컨대, 2-3 킬로헤르츠 (kHz) 미만인) 하부 대역들에서 파형 코딩될 수도 있다.
MS 코딩 및 PS 코딩은 주파수 도메인에서 또는 서브밴드 도메인에서 이루어질 수도 있다. 일부 예들에서, 좌측 채널 및 우측 채널은 비상관될 수도 있다. 예를 들어, 좌측 채널 및 우측 채널은 비상관된 합성 신호들을 포함할 수도 있다. 좌측 채널 및 우측 채널이 비상관될 때, MS 코딩, PS 코딩, 또는 양자의 코딩 효율은 이중-모노 코딩의 코딩 효율에 근접할 수도 있다.
리코딩 구성에 따라서, 좌측 채널과 우측 채널 사이의 시간 시프트 뿐만 아니라, 에코 및 룸 반향과 같은 다른 공간 효과들이 있을 수도 있다. 채널들 사이의 시간 시프트 및 위상 부정합이 보상되지 않으면, 합 채널 및 차이 채널은 MS 또는 PS 기법들과 연관된 코딩-이득들을 감소시키는 비견할만한 에너지들을 포함할 수도 있다. 코딩-이득들에서의 감소는 시간 (또는, 위상) 시프트의 양에 기초할 수도 있다. 합 신호 및 차이 신호의 비견할만한 에너지들은 채널들이 시간적으로 시프트되지만 고도로 상관되는 어떤 프레임들에서 MS 코딩의 사용을 제한할 수도 있다. 스테레오 코딩에서, 중간 채널 (예컨대, 합 채널) 및 사이드 채널 (예컨대, 차이 채널) 은 다음 수식에 기초하여 발생될 수도 있다:
M= (L+R)/2, S= (L-R)/2, 수식 1
여기서, M 은 중간 채널에 대응하며, S 는 사이드 채널에 대응하며, L 은 좌측 채널에 대응하며, R 은 우측 채널에 대응한다.
일부의 경우, 중간 채널 및 사이드 채널은 다음 수식에 기초하여 발생될 수도 있다:
M = c(L+R), S = c(L-R), 수식 2
여기서, c 는 프레임 마다, 하나의 주파수 또는 서브밴드로부터 다른 주파수 또는 서브밴드로, 또는 이들의 조합으로 변할 수도 있는 복수소 값 또는 실수 값에 대응한다.
일부의 경우, 중간 채널 및 사이드 채널은 다음 수식에 기초하여 발생될 수도 있다:
M = (c1*L + c2*R), S = (c3*L-c4*R), 수식 3
여기서, c1, c2, c3 및 c4 는 프레임 마다, 하나의 서브밴드 또는 주파수로부터 다른 서브밴드 또는 주파수까지, 또는 이들의 조합으로 변할 수도 있는 복수소 값들 또는 실수 값들이다. 수식 1, 수식 2, 또는 수식 3 에 기초하여 중간 채널 및 사이드 채널을 발생시키는 것은 "다운믹싱" 알고리즘을 수행하는 것으로서 지칭될 수도 있다. 수식 1, 수식 2, 또는 수식 3 에 기초하여 중간 채널 및 사이드 채널로부터 좌측 채널 및 우측 채널을 발생시키는 역전 프로세스는 "업믹싱" 알고리즘을 수행하는 것으로서 지칭될 수도 있다.
특정의 프레임에 대한 MS 코딩 또는 이중-모노 코딩 사이에 선택하는데 사용되는 애드-혹 접근법은 중간 신호 및 사이드 신호를 발생시키는 단계, 중간 신호 및 사이드 신호의 에너지들을 계산하는 단계, 및 그 에너지들에 기초하여 MS 코딩을 수행할지 여부를 결정하는 단계를 포함할 수도 있다. 예를 들어, MS 코딩은 사이드 신호 및 중간 신호의 에너지들의 비가 임계치 미만이라고 결정하는 것에 응답하여 수행될 수도 있다. 예시하기 위하여, 우측 채널이 적어도 제 1 시간 (예컨대, 약 0.001 초 또는 48 kHz에서 48 개의 샘플들) 만큼 시프트되면, (좌측 신호와 우측 신호의 합에 대응하는) 중간 신호의 제 1 에너지는 특정 프레임들에 대한 (좌측 신호와 우측 신호 사이의 차이에 대응하는) 사이드 신호의 제 2 에너지에 필적할 수도 있다. 제 1 에너지가 제 2 에너지에 필적할 때, 사이드 채널을 인코딩하는데 더 높은 비트수가 사용될 수도 있으며, 이에 의해, 이중-모노 코딩보다 MS 코딩의 코딩 효율을 감소시킬 수도 있다. 따라서, 제 1 에너지가 제 2 에너지에 필적할 때 (예컨대, 제 1 에너지 및 제 2 에너지의 비가 임계치 이상일 때) 이중-모노 코딩이 사용될 수도 있다. 대안 접근법에서, 특정의 프레임에 대한 MS 코딩과 이중-모노 코딩 사이의 결정은 좌측 채널 및 우측 채널의 임계치와 정규화된 교차-상관 값들의 비교에 기초하여 이루어질 수도 있다.
일부 예들에서, 인코더는 제 2 오디오 신호에 대한 제 1 오디오 신호의 시간 부정합 (예컨대, 시프트) 를 표시하는 부정합 값 (예컨대, 시간 시프트 값, 이득 값, 에너지 값, 채널간 예측 값) 을 결정할 수도 있다. 시프트 값 (예컨대, 부정합 값) 은 제 1 마이크로폰에서의 제 1 오디오 신호의 수신과 제 2 마이크로폰에서의 제 2 오디오 신호의 수신사이의 시간 지연의 양에 대응할 수도 있다. 더욱이, 인코더는 프레임 단위로, 예컨대, 각각의 20 밀리초 (ms) 음성/오디오 프레임에 기초하여, 시프트 값을 결정할 수도 있다. 예를 들어, 시프트 값은 제 2 오디오 신호의 제 2 프레임이 제 1 오디오 신호의 제 1 프레임에 대해 지연되는 시간의 양에 대응할 수도 있다. 대안적으로, 시프트 값은 제 1 오디오 신호의 제 1 프레임이 제 2 오디오 신호의 제 2 프레임에 대해 지연되는 시간의 양에 대응할 수도 있다.
사운드 소스가 제 2 마이크로폰보다 제 1 마이크로폰에 더 가까울 때, 제 2 오디오 신호의 프레임들은 제 1 오디오 신호의 프레임들에 대해 지연될 수도 있다. 이 경우, 제 1 오디오 신호는 "참조 오디오 신호" 또는 "참조 채널" 로서 지칭될 수도 있으며, 지연된 제 2 오디오 신호는 "목표 오디오 신호" 또는 "목표 채널" 로서 지칭될 수도 있다. 대안적으로, 사운드 소스가 제 1 마이크로폰 보다 제 2 마이크로폰에 더 가까울 때, 제 1 오디오 신호의 프레임들은 제 2 오디오 신호의 프레임들에 대해 지연될 수도 있다. 이 경우, 제 2 오디오 신호는 참조 오디오 신호 또는 참조 채널로서 지칭될 수도 있으며, 지연된 제 1 오디오 신호는 목표 오디오 신호 또는 목표 채널로서 지칭될 수도 있다.
사운드 소스들 (예컨대, 화자들) 이 회의 또는 원거리 영상회의 실에 로케이트되는 위치 또는 사운드 소스 (예컨대, 화자) 위치가 마이크로폰들에 대해 어떻게 변하는지에 따라서, 참조 채널 및 목표 채널은 프레임 마다 변할 수도 있으며; 유사하게, 시간 부정합 (예컨대, 시프트) 값이 또한 프레임 마다 변할 수도 있다. 그러나, 일부 구현예들에서, 시간 시프트 값은 "참조" 채널에 대한 "목표" 채널의 지연의 양을 표시하기 위해 항상 양일 수도 있다. 더욱이, 시프트 값은 목표 채널이 "참조" 채널과 정렬되도록 (예컨대, 최대로 정렬되도록) 그 지연된 목표 채널이 시간적으로 "풀 백 (pull back) 되는" "비-인과적 시프트" 값에 대응할 수도 있다. 목표 채널을 "풀백하는 것" 은 시간에서 목표 채널을 전진시키는 것에 대응한다. "비-인과적 시프트" 는 지연된 오디오 채널을 선행 오디오 채널과 시간적으로 정렬하기 위해 선행 오디오 채널에 대한 지연된 오디오 채널 (예컨대, 지체된 오디오 채널) 의 시프트에 대응할 수도 있다. 중간 채널 및 사이드 채널을 결정하는 다운믹스 알고리즘은 참조 채널 및 비-인과적 시프트된 목표 채널에 대해 수행될 수도 있다.
인코더는 제 1 오디오 채널, 및 제 2 오디오 채널에 적용된 복수의 시프트 값들에 기초하여 시프트 값을 결정할 수도 있다. 예를 들어, 제 1 오디오 채널의 제 1 프레임 X 는, 제 1 시간 (m1) 에서 수신될 수도 있다. 제 2 오디오 채널의 제 1 특정의 프레임 Y 는, 제 1 시프트 값, 예컨대, shift1 = n1 - m1 에 대응하는 제 2 시간 (n1) 에서 수신될 수도 있다. 또, 제 1 오디오 채널의 제 2 프레임은 제 3 시간 (m2) 에서 수신될 수도 있다. 제 2 오디오 채널의 제 2 특정의 프레임은 제 2 시프트 값, 예컨대, shift2 = n2 - m2 에 대응하는 제 4 시간 (n2) 에서 수신될 수도 있다.
디바이스는 프레이밍 또는 버퍼링 알고리즘을 수행하여, 제 1 샘플링 레이트 (예컨대, 32 kHz 샘플링 레이트 (즉, 프레임 당 640 개의 샘플들)) 에서 프레임 (예컨대, 20 ms 샘플들) 을 발생시킬 수도 있다. 인코더는 제 1 오디오 신호의 제 1 프레임 및 제 2 오디오 신호의 제 2 프레임이 디바이스에 동시에 도달한다고 결정하는 것에 응답하여, 시프트 값 (예컨대, shift1) 을 제로 샘플들과 동일한 것으로서 추정할 수도 있다. (예컨대, 제 1 오디오 신호에 대응하는) 좌측 채널 및 (예컨대, 제 2 오디오 신호에 대응하는) 우측 채널은 시간적으로 정렬될 수도 있다. 일부의 경우, 좌측 채널 및 우측 채널은, 심지어 정렬될 때에도, 다양한 이유들 (예컨대, 마이크로폰 교정) 로 인해 에너지가 상이할 수도 있다.
일부 예들에서, 좌측 채널 및 우측 채널은 다양한 이유들로 인해 시간적으로 부정합될 (예컨대, 정렬되지 않을) 수도 있다 (예컨대, 화자와 같은, 사운드 소스는 마이크로폰들 중 하나에, 다른 하나 보다 더 가까울 수도 있으며 2개의 마이크로폰들은 임계치 (예컨대, 1-20 센티미터) 거리 보다 크게 떨어져 있을 수도 있다). 마이크로폰들에 대한 사운드 소스의 로케이션은 좌측 채널 및 우측 채널에 상이한 지연들을 도입할 수도 있다. 게다가, 좌측 채널과 우측 채널 사이에, 이득 차이, 에너지 차이, 또는 레벨 차이가 있을 수도 있다.
일부 예들에서, 다수의 사운드 소스들 (예컨대, 화자들) 로부터 마이크로폰들에서의 오디오 신호들의 도달 시간은 다수의 화자들이 (예컨대, 중첩 없이) 교대로 대화 중일 때 변할 수도 있다. 이러한 경우, 인코더는 참조 채널을 식별하기 위해 화자에 기초하여 시간 시프트 값을 동적으로 조정할 수도 있다. 어떤 다른 예들에서, 다수의 화자들이 동시에 대화할 수도 있으며, 이는 가장 시끄러운 화자인 사람, 마이크로폰에 가장 가까운 사람, 등에 따라서 다양한 시간 시프트 값들을 초래할 수도 있다.
일부 예들에서, 제 1 오디오 신호 및 제 2 오디오 신호는 2개의 신호들이 더 적은 (예컨대, 전무한) 상관을 잠재적으로 보일 때에 합성되거나 또는 인공적으로 발생될 수도 있다. 본원에서 설명되는 예들은 예시적이고, 유사한 또는 상이한 상황들에서 제 1 오디오 신호와 제 2 오디오 신호 사이의 관계를 결정할 때에 유익할 수도 있는 것으로 이해되어야 한다.
인코더는 제 1 오디오 신호의 제 1 프레임과 제 2 오디오 신호의 복수의 프레임들의 비교에 기초하여 비교 값들 (예컨대, 차이 값들 또는 교차-상관 값들) 을 발생시킬 수도 있다. 복수의 프레임들의 각각의 프레임은 특정의 시프트 값에 대응할 수도 있다. 인코더는 비교 값들에 기초하여 제 1 추정된 시프트 값 (예컨대, 제 1 추정된 부정합 값) 을 발생시킬 수도 있다. 예를 들어, 제 1 추정된 시프트 값은 제 1 오디오 신호의 제 1 프레임과 대응하는 제 2 오디오 신호의 제 1 프레임 사이에 더 높은 시간-유사도 (또는, 더 낮은 차이) 을 표시하는 비교 값에 대응할 수도 있다. 포지티브 시프트 값 (예컨대, 제 1 추정된 시프트 값) 은 제 1 오디오 신호가 선행하는 오디오 신호 (예컨대, 시간적으로 선행하는 오디오 신호) 이고 제 2 오디오 신호가 지체된 오디오 신호 (예컨대, 시간적으로 지체된 오디오 신호) 임을 표시할 수도 있다. 지체된 오디오 신호의 프레임 (예컨대, 샘플들) 은 선행하는 오디오 신호의 프레임 (예컨대, 샘플들) 에 대해 시간적으로 지연될 수도 있다.
인코더는 일련의 추정된 시프트 값들을 다수의 단계들로 정제함으로써, 최종 시프트 값 (예컨대, 최종 부정합 값) 을 결정할 수도 있다. 예를 들어, 인코더는 제 1 오디오 신호 및 제 2 오디오 신호의 스테레오 사전 프로세싱된 및 리샘플링된 버전들로부터 발생된 비교 값들에 기초하여 "임시" 시프트 값을 먼저 추정할 수도 있다. 인코더는 추정된 "임시" 시프트 값에 가장 가까운 시프트 값들과 연관된 보간된 비교 값들을 발생시킬 수도 있다. 인코더는 보간된 비교 값들에 기초하여, 제 2 추정된 "보간된" 시프트 값을 결정할 수도 있다. 예를 들어, 제 2 추정된 "보간된" 시프트 값은 나머지 보간된 비교 값들 및 제 1 추정된 "임시" 시프트 값 보다 더 높은 시간-유사도 (또는, 더 낮은 차이) 를 표시하는 특정의 보간된 비교 값에 대응할 수도 있다. 현재의 프레임 (예컨대, 제 1 오디오 신호의 제 1 프레임) 의 제 2 추정된 "보간된" 시프트 값이 이전 프레임 (예컨대, 제 1 프레임에 선행하는 제 1 오디오 신호의 프레임) 의 최종 시프트 값과 상이하면, 현재의 프레임의 "보간된" 시프트 값은 제 1 오디오 신호와 시프트된 제 2 오디오 신호 사이의 시간-유사도를 향상시키기 위해 추가로 "정정된다". 특히, 제 3 추정된 "정정된" 시프트 값은 현재의 프레임의 제 2 추정된 "보간된" 시프트 값 및 이전 프레임의 최종 추정된 시프트 값 주위를 탐색함으로써, 더 정확한 시간-유사도의 측정치에 대응할 수도 있다. 제 3 추정된 "정정된" 시프트 값은 프레임들 사이의 시프트 값에서의 임의의 스퓨리어스 (spurious) 변화들을 제한함으로써 최종 시프트 값을 추정하도록 추가로 컨디셔닝될 수도 있으며, 본원에서 설명하는 바와 같이 2개의 연속적인 (또는, 연속된) 프레임들에서 네거티브 시프트 값으로부터 포지티브 시프트 값으로 (또는, 반대의 경우도 마찬가지이다) 스위칭하지 않도록 추가로 제어된다.
일부 예들에서, 인코더는 연속된 프레임들에서 또는 인접 프레임들에서 포지티브 시프트 값과 네거티브 시프트 값 사이에 또는 그 반대로도 스위칭하는 것을 억제할 수도 있다. 예를 들어, 인코더는 제 1 프레임의 추정된 "보간된" 또는 "정정된" 시프트 값, 및 제 1 프레임에 선행하는 특정의 프레임에서의 대응하는 추정된 "보간된" 또는 "정정된" 또는 최종 시프트 값에 기초하여, 최종 시프트 값을, 시간-시프트 없음을 표시하는 특정의 값 (예컨대, 0) 으로 설정할 수도 있다. 예시하기 위하여, 인코더는 현재의 프레임의 추정된 "임시" 또는 "보간된" 또는 "정정된" 시프트 값 중 하나가 양이고 이전 프레임 (예컨대, 제 1 프레임에 선행하는 프레임) 의 추정된 "임시" 또는 "보간된" 또는 "정정된" 또는 "최종" 추정된 시프트 값 중 다른 하나가 음이라고 결정하는 것에 응답하여, 현재의 프레임 (예컨대, 제 1 프레임) 의 최종 시프트 값을, 시간-시프트 없음, 즉, shift1 = 0 을 표시하도록, 설정할 수도 있다. 대안적으로, 인코더는 또한 현재의 프레임의 추정된 "임시" 또는 "보간된" 또는 "정정된" 시프트 값 중 하나가 음이고 이전 프레임 (예컨대, 제 1 프레임에 선행하는 프레임) 의 추정된 "임시" 또는 "보간된" 또는 "정정된" 또는 "최종" 추정된 시프트 값 중 다른 하나가 양이라고 결정하는 것에 응답하여, 현재의 프레임 (예컨대, 제 1 프레임) 의 최종 시프트 값을, 시간-시프트 없음, 즉, shift1 = 0 을 표시하도록 설정할 수도 있다. 본원에서 인용될 때, "시간-시프트" 는 시간-시프트, 시간-오프셋, 샘플 시프트, 샘플 오프셋, 또는 오프셋에 대응할 수도 있다.
인코더는 시프트 값에 기초하여, 제 1 오디오 신호 또는 제 2 오디오 신호의 프레임을 "참조" 또는 "목표" 로서 선택할 수도 있다. 예를 들어, 최종 시프트 값이 양이라고 결정하는 것에 응답하여, 인코더는 제 1 오디오 신호가 "참조" 신호라는 것 그리고 제 2 오디오 신호가 "목표" 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖는 참조 채널 또는 신호 표시자를 발생시킬 수도 있다. 대안적으로, 최종 시프트 값이 음이라고 결정하는 것에 응답하여, 인코더는 제 2 오디오 신호가 "참조" 신호라는 것 및 제 1 오디오 신호가 "목표" 신호라는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖는 참조 채널 또는 신호 표시자를 발생시킬 수도 있다.
참조 신호는 선행 신호에 대응할 수도 있으며, 반면 목표 신호는 지체된 신호에 대응할 수도 있다. 특정의 양태에서, 참조 신호는 제 1 추정된 시프트 값에 의해 선행 신호로서 표시되는 동일한 신호일 수도 있다. 대안적인 양태에서, 참조 신호는 제 1 추정된 시프트 값에 의해 선행 신호로서 표시되는 신호와 상이할 수도 있다. 참조 신호는 참조 신호가 선행 신호에 대응한다는 것을 제 1 추정된 시프트 값이 표시하는지 여부와 무관하게 선행 신호로서 취급될 수도 있다. 예를 들어, 참조 신호는 다른 신호 (예컨대, 목표 신호) 를 참조 신호에 대해 시프트시킴으로써 (예컨대, 조정함으로써) 선행 신호로서 취급될 수도 있다.
일부 예들에서, 인코더는 인코딩될 프레임에 대응하는 부정합 값 (예컨대, 추정된 시프트 값 또는 최종 시프트 값) 및 이전에 인코딩된 프레임들에 대응하는 부정합 (예컨대, 시프트) 값들에 기초하여, 목표 신호 또는 참조 신호 중 적어도 하나를 식별하거나 또는 결정할 수도 있다. 인코더는 부정합 값들을 메모리에 저장할 수도 있다. 목표 채널은 2개의 오디오 채널들의 시간적으로 지체된 오디오 채널에 대응할 수도 있으며, 참조 채널은 2개의 오디오 채널들의 시간적으로 선행하는 오디오 채널에 대응할 수도 있다. 일부 예들에서, 인코더는 시간적으로 지체된 채널을 식별할 수도 있으며, 메모리로부터의 부정합 값들에 기초하여, 목표 채널을 참조 채널과 최대로 정렬하지 않을 수도 있다. 예를 들어, 인코더는 하나 이상의 부정합 값들에 기초하여 목표 채널을 참조 채널과 부분적으로 정렬할 수도 있다. 일부 다른 예들에서, 인코더는 전체 부정합 값 (예컨대, 100 샘플들) 을 더 작은 부정합 값들 (예컨대, 25 샘플들, 25 샘플들, 25 샘플들, 및 25 샘플들) 로 인코딩된 다수의 프레임들 (예컨대, 4개의 프레임들) 에 걸쳐서 "비-인과적으로" 분산시킴으로써, 일련의 프레임들에 걸쳐서 목표 채널을 점진적으로 조정할 수도 있다.
인코더는 참조 신호 및 비-인과적 시프트된 목표 신호와 연관된 상대 이득 (예컨대, 상대 이득 파라미터) 을 추정할 수도 있다. 예를 들어, 최종 시프트 값이 양이라고 결정하는 것에 응답하여, 인코더는 비-인과적 시프트 값 (예컨대, 최종 시프트 값의 절대값) 만큼 오프셋된 제 2 오디오 신호에 대해 제 1 오디오 신호의 에너지 또는 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 대안적으로, 최종 시프트 값이 음이라고 결정하는 것에 응답하여, 인코더는 제 2 오디오 신호에 대한 비-인과적 시프트된 제 1 오디오 신호의 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 일부 예들에서, 인코더는 비-인과적 시프트된 "목표" 신호에 대한 "참조" 신호의 에너지 또는 전력 레벨들을 정규화 또는 등화하기 위해, 이득 값을 추정할 수도 있다. 다른 예들에서, 인코더는 목표 신호 (예컨대, 비시프트된 목표 신호) 에 대한 참조 신호에 기초하여 이득 값 (예컨대, 상대 이득 값) 을 추정할 수도 있다.
인코더는 참조 신호, 목표 신호 (예컨대, 시프트된 목표 신호 또는 비시프트된 목표 신호), 비-인과적 시프트 값, 및 상대 이득 파라미터에 기초하여, 적어도 하나의 인코딩된 신호 (예컨대, 중간 신호, 사이드 신호, 또는 양자) 를 발생시킬 수도 있다. 사이드 신호는 제 1 오디오 신호의 제 1 프레임의 제 1 샘플들과, 제 2 오디오 신호의 선택된 프레임의 선택된 샘플들 사이의 차이에 대응할 수도 있다. 인코더는 최종 시프트 값에 기초하여, 선택된 프레임을 선택할 수도 있다. 디바이스에 의해 제 1 프레임과 동시에 수신된 제 2 오디오 신호의 프레임에 대응하는 제 2 오디오 신호의 다른 샘플들과 비교하여, 제 1 샘플들과 선택된 샘플들 사이의 감소된 차이 때문에, 사이드 채널 신호를 인코딩하는데 더 적은 비트들이 사용될 수도 있다. 디바이스의 송신기는 적어도 하나의 인코딩된 신호, 비-인과적 시프트 값, 상대 이득 파라미터, 참조 채널 또는 신호 표시자, 또는 이들의 조합을 송신할 수도 있다.
인코더는 참조 신호, 목표 신호 (예컨대, 시프트된 목표 신호 또는 비시프트된 목표 신호), 비-인과적 시프트 값, 상대 이득 파라미터, 제 1 오디오 신호의 특정의 프레임의 저 대역 파라미터들, 특정의 프레임의 고 대역 파라미터들, 또는 이들의 조합에 기초하여, 적어도 하나의 인코딩된 신호 (예컨대, 중간 신호, 사이드 신호, 또는 양자) 를 발생시킬 수도 있다. 특정의 프레임은 제 1 프레임보다 선행할 수도 있다. 하나 이상의 선행하는 프레임들로부터의, 어떤 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합이 제 1 프레임의, 중간 신호, 사이드 신호, 또는 양자를 인코딩하는데 사용될 수도 있다. 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합에 기초하여, 중간 신호, 사이드 신호, 또는 양자를 인코딩하는 것은 비-인과적 시프트 값 및 채널간 상대 이득 파라미터의 추정들을 향상시킬 수도 있다. 저 대역 파라미터들, 고 대역 파라미터들, 또는 이들의 조합은 피치 파라미터, 보이싱 파라미터, 코더 유형 파라미터, 저-대역 에너지 파라미터, 고-대역 에너지 파라미터, 기울기 파라미터, 피치 이득 파라미터, FCB 이득 파라미터, 코딩 모드 파라미터, 보이스 활성도 파라미터, 잡음 추정 파라미터, 신호-대-잡음비 파라미터, 포르만츠 파라미터, 음성/음악 결정 파라미터, 비-인과적 시프트, 채널간 이득 파라미터, 또는 이들의 조합을 포함할 수도 있다. 디바이스의 송신기는 적어도 하나의 인코딩된 신호, 비-인과적 시프트 값, 상대 이득 파라미터, 참조 채널 (또는, 신호) 표시자, 또는 이들의 조합을 송신할 수도 있다. 본원에서 인용될 때, 오디오 "신호" 은 오디오 "채널" 에 대응한다. 본원에서 인용될 때, "시프트 값" 은 오프셋 값, 부정합 값, 시간-오프셋 값, 샘플 시프트 값, 또는 샘플 오프셋 값에 대응한다. 본원에서 인용될 때, 목표 신호를 "시프트시키는 것" 은 목표 신호를 나타내는 데이터의 로케이션(들) 을 시프트시키는 것, 데이터를 하나 이상의 메모리 버퍼들에 복사하는 것, 목표 신호와 연관된 하나 이상의 메모리 포인터들을 이동시키는 것, 또는 이들의 조합에 대응할 수도 있다.
일부 인코딩 구현예들에 따르면, 비-인과적 시프팅은 참조 채널 및 목표 채널을 시간적으로 정렬하는데 사용될 수도 있다. 예를 들어, 목표 채널은 참조 채널과 실질적으로 시간적으로 정렬되는 수정된 목표 채널을 발생시키기 위해 비-인과적 시프트 값 만큼 시간적으로 시프트될 수도 있다. 수정된 목표 채널을 발생시키기 위해 목표 채널을 시프트시킴에 있어서, 손상된 부분들 (예컨대, 손실된 목표 샘플들) 이 존재하게 될 수도 있다. 예를 들어, 비-인과적 시프팅 이후 목표 채널로부터의 이용불가능한 샘플들이 존재할 수도 있다.
손실된 목표 샘플들을 발생시키기 위해, 인코더는 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 단기/장기 상관 및 시간 유사성을 표시하는 시간 상관 값을 결정할 수도 있다. 하나의 예시적인 구현예들에서, 제 1 신호 및 제 2 신호는 참조 채널의 참조 프레임의 부분 및 목표 채널의 목표 프레임의 대응하는 부분에 대응한다. 비한정적인 예로서, 참조 프레임은 20 밀리초 (ms) 의 프레임 지속기간을 가질 수도 있으며, 제 1 신호는 참조 프레임의 5 ms 부분에 대응할 수도 있다. 이와 유사하게, 목표 프레임은 20 ms 의 프레임 지속기간을 가질 수도 있으며, 제 2 신호는 목표 프레임의 5 ms 부분에 대응할 수도 있다. 높은 시간 상관 값은 참조 채널 및 수정된 목표 채널이 실질적으로 시간적으로 정렬된다는 것을 표시할 수도 있다. 높은 시간 상관 값은 또한 단기 및 장기 상관이 충분히 유사하다는 것을 표시할 수도 있다. 낮은 시간 상관 값은 참조 채널 및 수정된 목표 채널이 실질적으로 시간적으로 오정렬된다는 것을 표시할 수도 있다. 시간 상관 값이 상대적으로 높으면 (예컨대, 제 1 임계치를 만족시키면), 인코더는 참조 채널에 기초하여, 손실된 목표 샘플들을 발생시킬 수도 있다. 예를 들어, 비-인과적 시프팅 후 참조 채널과 수정된 목표 채널 사이에 큰 (예컨대, 강한) 시간 상관이 있으면, 손실된 목표 샘플들은 참조 채널에 기초하여 발생될 수도 있다. 시간 상관 값이 상대적으로 낮으면 (예컨대, 제 2 임계치를 만족시키지 못하면), 인코더는 참조 채널과는 독립적으로, 손실된 목표 샘플들을 발생시킬 수도 있다. 비한정적인 예로서, 비-인과적 시프팅 후 참조 채널과 수정된 목표 채널 사이에 작은 (예컨대, 약한) 시간 상관이 있으면, 손실된 목표 샘플들은 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여, 목표 채널 자체의 외삽에 기초하여, 제로 값들에 기초하여, 또는 이들의 조합에 기초하여 발생될 수도 있다.
도 1 을 참조하면, 시스템의 특정의 예시적인 예가 개시되며 일반적으로 100 으로 지정된다. 시스템 (100) 은 네트워크 (120) 를 통해서 제 2 디바이스 (106) 에 통신가능하게 커플링된 제 1 디바이스 (104) 를 포함한다. 네트워크 (120) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다.
제 1 디바이스 (104) 는 인코더 (114), 송신기 (110), 하나 이상의 입력 인터페이스들 (112), 또는 이들의 조합을 포함할 수도 있다. 입력 인터페이스들 (112) 의 제 1 입력 인터페이스는 제 1 마이크로폰 (146) 에 커플링될 수도 있다. 입력 인터페이스(들) (112) 의 제 2 입력 인터페이스는 제 2 마이크로폰 (148) 에 커플링될 수도 있다. 인코더 (114) 는 시간 등화기 (108) 를 포함할 수도 있으며, 본원에서 설명하는 바와 같이, 다수의 오디오 신호들을 다운믹싱하여 인코딩하도록 구성될 수도 있다. 제 1 디바이스 (104) 는 또한 분석 데이터 (190) 를 저장하도록 구성된 메모리 (153) 를 포함할 수도 있다. 제 2 디바이스 (106) 는 디코더 (118) 를 포함할 수도 있다. 디코더 (118) 는 다수의 채널들을 업믹싱하여 렌더링하도록 구성된 시간 밸런서 (124) 를 포함할 수도 있다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 또는 양자에 커플링될 수도 있다.
동작 동안, 제 1 디바이스 (104) 는 제 1 마이크로폰 (146) 으로부터 제 1 입력 인터페이스를 통해서 제 1 오디오 신호 (130) 를 수신할 수도 있으며, 제 2 마이크로폰 (148) 으로부터 제 2 입력 인터페이스를 통해서 제 2 오디오 신호 (132) 를 수신할 수도 있다. 제 1 오디오 신호 (130) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (132) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다. 제 1 마이크로폰 (146) 및 제 2 마이크로폰 (148) 은 사운드 소스 (152) (예컨대, 사용자, 스피커, 주변 잡음, 악기, 등) 로부터 오디오를 수신할 수도 있다. 특정의 양태에서, 제 1 마이크로폰 (146), 제 2 마이크로폰 (148), 또는 양자는 다수의 사운드 소스들로부터 오디오를 수신할 수도 있다. 다수의 사운드 소스들은 지배적인 (또는, 대부분의 지배적인) 사운드 소스 (예컨대, 사운드 소스 (152)) 및 하나 이상의 2차 사운드 소스들을 포함할 수도 있다. 하나 이상의 2차 사운드 소스들은 트래픽, 백그라운드 음악, 다른 화자, 거리 잡음, 등에 대응할 수도 있다. 사운드 소스 (152) (예컨대, 지배적인 사운드 소스) 는 제 2 마이크로폰 (148) 보다 제 1 마이크로폰 (146) 에 더 가까울 수도 있다. 따라서, 사운드 소스 (152) 로부터의 오디오 신호가 제 2 마이크로폰 (148) 을 통한 것 보다 더 빠른 시간에 제 1 마이크로폰 (146) 을 통해서 입력 인터페이스(들) (112) 에서 수신될 수도 있다. 다수의 마이크로폰들을 통한 멀티-채널 신호 획득에서의 이러한 자연스러운 지연은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이에 시간 시프트를 도입할 수도 있다.
제 1 디바이스 (104) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자를, 메모리 (153) 에 저장할 수도 있다. 시간 등화기 (108) 는 도 10a 내지 도 10b 를 참조하여 추가로 설명된 바와 같이, 제 2 오디오 신호 (132) (예컨대, "참조") 에 대한 제 1 오디오 신호 (130) (예컨대, "목표") 의 시프트 (예컨대, 비-인과적 시프트) 를 표시하는 최종 시프트 값 (116) (예컨대, 비-인과적 시프트 값) 을 결정할 수도 있다. 최종 시프트 값 (116) (예컨대, 최종 부정합 값) 은 제 1 오디오 신호와 제 2 오디오 신호 사이의 시간 부정합 (예컨대, 시간 지연) 의 양을 표시할 수도 있다. 본원에서 인용될 때, "시간 지연" 은 "시간 지연" 에 대응할 수도 있다. 시간 부정합은 제 1 마이크로폰 (146) 을 통한, 제 1 오디오 신호 (130) 의 수신과 제 2 마이크로폰 (148) 을 통한, 제 2 오디오 신호 (132) 의 수신 사이의 시간 지연을 표시할 수도 있다.
최종 시프트 값 (116) 의 제 1 값 (예컨대, 포지티브 값) 은 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 에 대해 지연된다는 것을 표시할 수도 있다. 이 예에서, 제 1 오디오 신호 (130) 는 선행 신호에 대응할 수도 있으며, 제 2 오디오 신호 (132) 는 지체된 신호에 대응할 수도 있다. 최종 시프트 값 (116) 의 제 2 값 (예컨대, 네거티브 값) 은 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 지연된다는 것을 표시할 수도 있다. 이 예에서, 제 1 오디오 신호 (130) 는 지체된 신호에 대응할 수도 있으며, 제 2 오디오 신호 (132) 는 선행 신호에 대응할 수도 있다. 최종 시프트 값 (116) 의 제 3 값 (예컨대, 0) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이에 지연 없음을 표시할 수도 있다.
일부 구현예들에서, 최종 시프트 값 (116) 의 제 3 값 (예컨대, 0) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다는 것을 표시할 수도 있다. 예를 들어, 제 1 오디오 신호 (130) 의 제 1 특정의 프레임은 제 1 프레임보다 선행할 수도 있다. 제 2 오디오 신호 (132) 의 제 1 특정의 프레임 및 제 2 특정의 프레임은 사운드 소스 (152) 에 의해 방출된 동일한 사운드에 대응할 수도 있다. 동일한 사운드는 제 2 마이크로폰 (148) 에서보다 제 1 마이크로폰 (146) 에서 조기에 검출될 수도 있다. 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연은 제 2 특정의 프레임에 대해 지연된 제 1 특정의 프레임을 갖는 것으로부터 제 1 프레임에 대해 지연된 제 2 프레임을 갖는 것으로 스위칭할 수도 있다. 대안적으로, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연은 제 1 특정의 프레임에 대해 지연된 제 2 특정의 프레임을 갖는 것으로부터 제 2 프레임에 대해 지연된 제 1 프레임을 갖는 것으로 스위칭할 수도 있다. 시간 등화기 (108) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다고 결정하는 것에 응답하여, 도 10a 내지 도 10b 와 참조하여 추가로 설명된 바와 같이, 제 3 값 (예컨대, 0) 을 표시하도록 최종 시프트 값 (116) 을 설정할 수도 있다.
시간 등화기 (108) 는 도 12 를 참조하여 더 설명된 바와 같이, 최종 시프트 값 (116) 에 기초하여 참조 신호 표시자 (164) (예컨대, 참조 채널 표시자) 를 발생시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 1 값 (예컨대, 포지티브 값) 을 표시한다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 가 "참조" 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖도록 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 1 값 (예컨대, 포지티브 값) 을 표시한다고 결정하는 것에 응답하여, 제 2 오디오 신호 (132) 가 "목표" 신호에 대응한다고 결정할 수도 있다. 대안적으로, 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 표시한다고 결정하는 것에 응답하여, 제 2 오디오 신호 (132) 가 "참조" 신호라고 표시하는 제 2 값 (예컨대, 1) 을 갖도록 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 표시한다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 가 "목표" 신호에 대응한다고 결정할 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 3 값 (예컨대, 0) 을 표시한다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 가 "참조" 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖도록 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 3 값 (예컨대, 0) 을 표시한다고 결정하는 것에 응답하여, 제 2 오디오 신호 (132) 가 "목표" 신호에 대응한다고 결정할 수도 있다. 대안적으로, 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 3 값 (예컨대, 0) 을 표시한다고 결정하는 것에 응답하여, 제 2 오디오 신호 (132) 가 "참조" 신호라는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖도록 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 3 값 (예컨대, 0) 을 표시한다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 가 "목표" 신호에 대응한다고 결정할 수도 있다. 일부 구현예들에서, 시간 등화기 (108) 는 최종 시프트 값 (116) 이 제 3 값 (예컨대, 0) 을 표시한다고 결정하는 것에 응답하여, 참조 신호 표시자 (164) 를 변경되지 않은 채로 유지할 수도 있다. 예를 들어, 참조 신호 표시자 (164) 는 제 1 오디오 신호 (130) 의 제 1 특정의 프레임에 대응하는 참조 신호 표시자와 동일할 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 의 절대값을 표시하는 비-인과적 시프트 값 (162) (예컨대, 비-인과적 부정합 값) 을 발생시킬 수도 있다.
시간 등화기 (108) 는 "목표" 신호의 샘플들에 기초하여, 그리고 "참조" 신호의 샘플들에 기초하여, 이득 파라미터 (160) (예컨대, 코덱 이득 파라미터) 를 발생시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 비-인과적 시프트 값 (162) 에 기초하여, 제 2 오디오 신호 (132) 의 샘플들을 선택할 수도 있다. 본원에서 인용될 때, 시프트 값에 기초하여 오디오 신호의 샘플들을 선택하는 것은 시프트 값에 기초하여 오디오 신호를 조정하고 (예컨대, 시프트시키고) 수정된 오디오 신호의 샘플들을 선택함으로써, 수정된 (예컨대, 시간-시프트된) 오디오 신호를 발생시키는 것에 대응할 수도 있다. 예를 들어, 시간 등화기 (108) 는 비-인과적 시프트 값 (162) 에 기초하여 제 2 오디오 신호 (132) 를 시프트시킴으로써 시간-시프트된 제 2 오디오 신호를 발생시킬 수도 있으며, 시간-시프트된 제 2 오디오 신호의 샘플들을 선택할 수도 있다. 시간 등화기 (108) 는 비-인과적 시프트 값 (162) 에 기초하여 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 의 단일 오디오 신호 (예컨대, 단일 채널) 를 조정할 (예컨대, 시프트시킬) 수도 있다. 대안적으로, 시간 등화기 (108) 는 비-인과적 시프트 값 (162) 과는 독립적으로, 제 2 오디오 신호 (132) 의 샘플들을 선택할 수도 있다. 시간 등화기 (108) 는 제 1 오디오 신호 (130) 가 참조 신호라고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 의 제 1 프레임의 제 1 샘플들에 기초하여, 선택된 샘플들의 이득 파라미터 (160) 를 결정할 수도 있다. 대안적으로, 시간 등화기 (108) 는 제 2 오디오 신호 (132) 가 참조 신호라고 결정하는 것에 응답하여, 선택된 샘플들에 기초하여, 제 1 샘플들의 이득 파라미터 (160) 를 결정할 수도 있다. 일 예로서, 이득 파라미터 (160) 는 다음 수식들 중 하나에 기초할 수도 있다:
Figure pct00001
수식 1a
Figure pct00002
수식 1b
Figure pct00003
수식 1c
Figure pct00004
수식 1d
Figure pct00005
수식 1e
Figure pct00006
수식 1f
여기서, gD 는 다운믹스 프로세싱을 위한 상대 이득 파라미터 (160) 에 대응하며, Ref(n) 은 "참조" 신호의 샘플들에 대응하며, N1 은 제 1 프레임의 비-인과적 시프트 값 (162) 에 대응하며, Targ(n+N1) 은 "목표" 신호의 샘플들에 대응한다. 이득 파라미터 (160) (gD) 는 예컨대, 수식들 1a - 1f 중 하나에 기초하여, 프레임들 사이의 이득에서의 큰 급등들 (jumps) 을 피하기 위해 장기 평활화/히스테리시스 로직을 포함하도록, 수정될 수도 있다. 목표 신호가 제 1 오디오 신호 (130) 를 포함할 때, 제 1 샘플들은 목표 신호의 샘플들을 포함할 수도 있으며, 선택된 샘플들은 참조 신호의 샘플들을 포함할 수도 있다. 목표 신호가 제 2 오디오 신호 (132) 를 포함할 때, 제 1 샘플들은 참조 신호의 샘플들을 포함할 수도 있으며, 선택된 샘플들은 목표 신호의 샘플들을 포함할 수도 있다.
일부 구현예들에서, 시간 등화기 (108) 는 제 1 오디오 신호 (130) 를 참조 신호로서 취급하는 것, 및 제 2 오디오 신호 (132) 를 목표 신호로서 취급하는 것에 기초하여, 참조 신호 표시자 (164) 와는 관계없이, 이득 파라미터 (160) 를 발생시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 수식들 1a-1f 중 하나에 기초하여, 이득 파라미터 (160) 를 발생시킬 수도 있으며, 여기서, Ref(n) 은 제 1 오디오 신호 (130) 의 샘플들 (예컨대, 제 1 샘플들) 에 대응하며, Targ(n+N1) 은 제 2 오디오 신호 (132) 의 샘플들 (예컨대, 선택된 샘플들) 에 대응한다. 대안적인 구현예들에서, 시간 등화기 (108) 는 제 2 오디오 신호 (132) 를 참조 신호로서 취급하는 것, 및 제 1 오디오 신호 (130) 를 목표 신호로서 취급하는 것에 기초하여, 참조 신호 표시자 (164) 와는 관계없이, 이득 파라미터 (160) 를 발생시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 수식들 1a-1f 중 하나에 기초하여 이득 파라미터 (160) 를 발생시킬 수도 있으며, 여기서, Ref(n) 은 제 2 오디오 신호 (132) 의 샘플들 (예컨대, 선택된 샘플들) 에 대응하며, Targ(n+N1) 은 제 1 오디오 신호 (130) 의 샘플들 (예컨대, 제 1 샘플들) 에 대응한다.
일 구현예에 따르면, 시간 등화기 (108) 는 목표 채널 (예컨대, 제 1 오디오 신호 (130)) 을 최종 시프트 값 (116) 만큼 시프트시켜 수정된 목표 채널 (194) 을 발생시키도록 구성될 수도 있다. 인코더 (114) 는 수정된 목표 채널 (194) 과 참조 채널 (예컨대, 제 2 오디오 신호 (132)) 사이의 시간 상관 값 (192) 을 결정할 수도 있다. 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 시간 상관을 표시할 수도 있다. 일부 구현예들에 따르면, 시간 상관 값 (192) 은 참조 채널의 참조 프레임과 수정된 목표 채널 (194) 의 대응하는 목표 프레임 사이의 시간 상관 관계를 표시할 수도 있다. 시간 상관 값 (192) 은 분석 데이터 (190) 를 메모리 (153) 에 저장될 수도 있다.
시간 상관 값 (192) 은 최종 시프트 값 (116) 과 "실제 (true)" 시프트 사이의 차이에 기초하여 결정될 수도 있다. 예를 들어, 실제 시프트는 참조 채널과 시간적으로 정렬되는 수정된 목표 채널 (194) 을 발생시키기 위해 목표 채널에 적용될 시프트 양일 수도 있다. 비-인과적 시프팅이 여러 프레임들에 걸쳐서 수행될 수도 있기 때문에, 시간 상관 값 (192) 은 프레임 당 허용가능 시간 시프트 양에 의해 정규화될 수도 있다. 예를 들어, 주어진 프레임이 최대 20 ms (예컨대, 허용가능 시간 시프트 양) 만큼 시프트될 수 있으면, 시간 상관 값 (192) 은 20 ms 시프트 양에 기초하여 정규화될 수도 있다. 예시하기 위하여, 참조 프레임과 목표 프레임 사이의 시간 차이가 5 ms 이면, 시간 상관 값 (192) 은 허용가능 시간 시프트 양으로부터 시간 차이를 감산하고 (예컨대, 20 ms - 5 ms) 허용가능 시간 시프트 양 (예컨대, 15 ms/20 ms) 에 대해 정규화함으로써 결정될 수도 있다. 따라서, 시간 상관 값 (192) 은 "0.75" 일 수도 있다.
다른 구현예에 따르면, 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 시간 오정렬에 기초할 수도 있다. 비한정적인 예로서, 참조 채널과 수정된 목표 채널 (192) 사이의 시간 차이가 80 ms 이면, 시간 상관 값 (192) 은 80 ms 차이에 기초할 수도 있다. 하나 이상의 임계치들이 시간 상관 값 (192) (예컨대, 80 ms) 에 기초하여 상관을 결정하기 위해 인코더 (114) 에 의해 설정될 수도 있다. 비한정적인 예로서, 제 1 임계치는 70 ms 와 동일할 수도 있으며, 제 2 임계치는 50 ms 와 동일할 수도 있으며, 제 3 임계치는 25 ms 와 동일할 수도 있다. 시간 상관 값 (192) 이 제 1 임계치 이상이기 때문에, 참조 채널과 수정된 목표 채널 (194) 사이에 상관이 낮을 수도 있다. 그 결과, 제로 값이 손실된 목표 샘플들 (196) 을 발생시키기 위해 사용될 수도 있다. 시간 상관 값 (192) 이 제 1 임계치와 제 2 임계치 사이인 다른 시나리오들에서, 목표 채널로부터 필터링된 무작위 잡음이 손실된 목표 샘플들 (196) 을 발생시키는데 사용될 수도 있다. 시간 상관 값 (192) 이 제 2 임계치와 제 3 임계치 사이에 있는 다른 시나리오들에서, 목표 채널에 기초한 외삽들이 손실된 목표 샘플들 (196) 을 발생시키는데 사용될 수도 있다. 시간 상관 값 (192) 이 제 3 임계치 미만인 다른 시나리오들에서, 손실된 목표 샘플들 (196) 은 참조 채널에 기초하여 발생될 수도 있다. 이전 시나리오들이 단지 예시적인 목적들을 위한 것이며 한정하는 것으로 해석되어서는 안된다는 것으로 이해되어야 한다. 예를 들어, 다른 시나리오들에서, 단일 임계치가 손실된 목표 샘플들 (196) 을 발생시키는 방법을 결정하기 위해 시간 상관 값 (192) 과 함께 사용될 수도 있다.
일 구현예에 따르면, 시간 상관 값 (192) 은 제로로부터 1 까지의 범위일 수도 있다. 1 의 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 "강한 상관" 을 표시한다. 예를 들어, 1 의 시간 상관 값 (192) 은 참조 채널 및 수정된 목표 채널 (194) 이 시간적으로 정렬된다는 것을 표시할 수도 있다. 제로의 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 "약한 상관" 을 표시한다. 예를 들어, 제로의 시간 상관 값 (192) 은 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 오정렬된다는 것을 표시할 수도 있다.
일 구현예에 따르면, 시간 상관 값 (192) 은 제로로부터 1 까지의 범위일 수도 있다. 시간 상관 값 (192) 은 임시 시프트 값을 결정하는데 발생되는 비교 값들 (예컨대, 교차-상관 값들), 보간된 시프트 값을 결정하는데 사용되는 비교 값들, 또는 최종 시프트 값 (116) 을 결정하는 프로세스에서 발생된 임의의 다른 비교 값들에 기초할 수도 있다. 특정의 구현예에서, 최종 시프트 값 (116) 에 대응하는 비교 값은 시간 상관 값 (192) 으로서 사용될 수도 있다.
대응하는 목표 프레임의 목표 샘플들이 최종 시프트 값 (116) 에 의해 목표 채널 (예컨대, 제 1 오디오 신호 (130)) 에 대해 시프트되기 때문에, 목표 프레임의 목표 샘플들이 시프트의 결과로서 손실될 수도 있다. 예를 들어, 손실된 목표 샘플들은 시프트의 결과로서 목표 프레임으로부터 시간-시프트된 제 1 오디오 신호 (130) 의 목표 샘플들에 대응할 수도 있다. 일부 구현예들에 따르면, 시간 등화기 (108) 는 참조 채널의 샘플들 및 수정된 목표 채널 (194) 의 샘플들 (예컨대, 시간-시프트된 및 조정된 샘플들) 에 기초하여 중간 신호를 발생시킬 수도 있다. 시간-시프팅은 적어도 하나의 "손상된" 부분을 포함하는 중간 신호를 초래할 수도 있다. 특정의 양태에서, 손상된 부분은 참조 채널로부터의 샘플 정보를 포함하고 목표 채널로부터의 샘플 정보를 제외한다. 일부의 경우, 비-인과적 시프팅 이후 목표 채널로부터의 이용불가능한 샘플들은 다른 정보 (예컨대, 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음, 목표 채널의 외삽들, 참조 채널, 등) 로부터 예측될 수도 있다. 예를 들어, 시간 등화기 (108) 는 다른 정보에 기초하여 예측된 샘플들을 발생시킬 수도 있다. 예측 (즉, 예측된 샘플들) 은 예측된 샘플들이 목표 채널의 이용불가능한 샘플들과 상이한 결과로, 불완전할 수도 있다.
시간 등화기 (108) 는 시간 상관 값 (192) 을 하나 이상의 임계치들과 비교하여, 손실된 목표 샘플들 (196) 을 발생시키는 방법을 결정할 수도 있다. 예를 들어, 시간 등화기 (108) 는 시간 상관 값 (192) 을 제 1 임계치와 비교할 수도 있다. 비한정적인 예로서, 제 1 임계치는 "0.8" 일 수도 있다. 따라서, 시간 상관 값 (192) 이 "0.8" 이상이면, 시간 상관 값 (192) 은 제 1 임계치를 만족시킬 수도 있다. 시간 상관 값 (192) 이 제 1 임계치를 만족시키면, 참조 채널과 수정된 목표 채널 (194) 사이에 높은 상관이 있을 수도 있다. 시간 상관 값 (192) 이 제 1 임계치를 만족시키면 (예컨대, 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 정렬되면), 인코더 (114) 는 참조 채널에 기초하여, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 예를 들어, 인코더 (114) 는 참조 채널과 연관된 참조 샘플들을 이용하여, 목표 채널을 시간-시프팅하는 것으로부터 발생하는 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다.
시간 상관 값 (192) 이 제 1 임계치를 만족시키지 못하면, 인코더 (114) 는 시간 상관 값 (192) 이 제 2 임계치를 만족시키는지 여부를 결정할 수도 있다. 비한정적인 예로서, 제 2 임계치는 "0.1" 일 수도 있다. 따라서, 시간 상관 값 (192) 이 "0.1" 이하이면, 시간 상관 값 (192) 은 제 2 임계치를 만족시키지 못할 수도 있다. 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못하면, 참조 채널과 수정된 목표 채널 (194) 사이에 낮은 상관이 있을 수도 있다. 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못하면 (예컨대, 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 오정렬되면), 인코더 (114) 는 참조 채널과는 독립적으로, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다.
예시하기 위하여, 인코더 (114) 는 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 손실된 목표 샘플들 (196) 의 발생에서 참조 채널의 사용을 우회할 (즉, 사용하지 않을) 수도 있다. 일 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 선형 예측 필터를 이용하여 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 제로 값들로 설정될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 수정된 목표 채널 (194) 로부터 외삽될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 참조 채널로부터의 스케일링된 여기 신호에 기초하여 발생될 수도 있다. 스케일링된 여기 신호는 참조 채널 상에서 LPC 분석 동작을 수행하고 목표 채널의 가용 샘플들로부터 유도된 선형 예측 필터를 이용하여 이 스케일링된 여기 신호를 필터링함으로써 유도될 수도 있다.
시간 상관 값 (192) 이 제 2 임계치를 만족하고 제 1 임계치를 만족시키지 못하면, 인코더 (114) 는 참조 채널에 부분적으로 기초하여 그리고 참조 채널에 부분적으로 독립적으로 기초하여, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 비한정적인 예로서, 시간 상관 값 (192) 이 "0.8" 과 "0.1" 사이이면, 인코더 (114) 는 제 1 가중치 (w1) 를, 참조 채널의 참조 샘플들에 기초하여 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있으며, 제 2 가중치 (w2) 를, 참조 채널과는 독립적으로, 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있다. 예시하기 위하여, 제 1 개수의 손실된 목표 샘플들 (196) 은 참조 채널에 기초하여 발생될 수도 있으며, 제 2 개수의 손실된 목표 샘플들 (196) 은 목표 채널에 기초하여 발생될 수도 있다. 다른 구현예들에서, 손실된 목표 샘플들 (196) 은 참조 채널, 목표 채널, 제로 값들, 무작위 잡음, 또는 이들의 조합에 기초하여 발생될 수도 있다. 다른 대안적인 구현예에서, 가중치들 (w1, w2) 은 시간 상관 값 (192) 이 임계치를 만족시키는지 여부에 의존하지 않을 수도 있다. 예를 들어, 가중치들 (w1, w2) 은 시간 상관 값 (192) 의 실제 값으로부터의 맵핑 함수에 기초할 수도 있다. 단지 2개의 가중치들 (w1, w2) 이 설명되지만, 손실된 목표 채널 샘플들을 예측하여 다수의 가중치들을 발생시키기 위한 2 개 초과의 기법들이 존재하는 대안적인 구현예들이 있을 수 있다는 점에 유의해야 한다.
시간 등화기 (108) 는 제 1 샘플들, 선택된 샘플들, 및 다운믹스 프로세싱을 위한 상대 이득 파라미터 (160) 에 기초하여, 하나 이상의 인코딩된 신호들 (102) (예컨대, 중간 채널 신호, 사이드 채널 신호, 또는 양자) 을 발생시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 다음 수식들 중 하나에 기초하여, 중간 신호를 발생시킬 수도 있다:
Figure pct00007
수식 2a
Figure pct00008
수식 2b
여기서, M 은 중간 채널 신호에 대응하며, gD 는 다운믹스 프로세싱을 위한 상대 이득 파라미터 (160) 에 대응하며, Ref(n) 은 "참조" 신호의 샘플들에 대응하며, N1 은 제 1 프레임의 비-인과적 시프트 값 (162) 에 대응하며, Targ(n+N1) 은 "목표" 신호의 샘플들에 대응한다.
시간 등화기 (108) 는 다음 수식들 중 하나에 기초하여 사이드 채널 신호를 발생시킬 수도 있다:
Figure pct00009
수식 3a
Figure pct00010
수식 3b
여기서, S 는 사이드 채널 신호에 대응하며, gD 는 다운믹스 프로세싱을 위한 상대 이득 파라미터 (160) 에 대응하며, Ref(n) 은 "참조" 신호의 샘플들에 대응하며, N1 은 제 1 프레임의 비-인과적 시프트 값 (162) 에 대응하며, Targ(n+N1) 은 "목표" 신호의 샘플들에 대응한다.
송신기 (110) 는 인코딩된 신호들 (102) (예컨대, 중간 채널 신호, 사이드 채널 신호, 또는 양자), 참조 신호 표시자 (164), 비-인과적 시프트 값 (162), 이득 파라미터 (160), 또는 이들의 조합을, 네트워크 (120) 를 통해서, 제 2 디바이스 (106) 로 송신할 수도 있다. 일부 구현예들에서, 송신기 (110) 는 인코딩된 신호들 (102) (예컨대, 중간 채널 신호, 사이드 채널 신호, 또는 양자), 참조 신호 표시자 (164), 비-인과적 시프트 값 (162), 이득 파라미터 (160), 또는 이들의 조합을, 추후 추가적인 프로세싱 또는 디코딩을 위해 네트워크 (120) 의 디바이스 또는 로컬 디바이스에 저장할 수도 있다.
디코더 (118) 는 인코딩된 신호들 (102) 을 디코딩할 수도 있다. 시간 밸런서 (124) 는 업믹싱하여, (예컨대, 제 1 오디오 신호 (130) 에 대응하는) 제 1 출력 신호 (126), (예컨대, 제 2 오디오 신호 (132) 에 대응하는) 제 2 출력 신호 (128), 또는 양자를 발생시킬 수도 있다. 제 2 디바이스 (106) 는 제 1 출력 신호 (126) 를 제 1 라우드스피커 (142) 를 통해서 출력할 수도 있다. 제 2 디바이스 (106) 는 제 2 출력 신호 (128) 를 제 2 라우드스피커 (144) 를 통해서 출력할 수도 있다.
따라서, 시스템 (100) 은 시간 등화기 (108) 로 하여금, 중간 신호보다 더 적은 비트들을 이용하여 사이드 채널 신호를 인코딩하게 할 수도 있다. 제 1 오디오 신호 (130) 의 제 1 프레임의 제 1 샘플들 및 제 2 오디오 신호 (132) 의 선택된 샘플들은 사운드 소스 (152) 에 의해 방출된 동일한 사운드에 대응할 수도 있으며, 따라서, 제 1 샘플들과 선택된 샘플들 사이의 차이가 제 2 오디오 신호 (132) 의 제 1 샘플들과 다른 샘플들 사이보다 작을 수도 있다. 사이드 채널 신호는 제 1 샘플들과 선택된 샘플들 사이의 차이에 대응할 수도 있다.
도 2 를 참조하면, 시스템의 특정의 예시적인 양태가 개시되며 일반적으로 200 으로 지정된다. 시스템 (200) 은 네트워크 (120) 를 통해서 제 2 디바이스 (106) 에 커플링된 제 1 디바이스 (204) 를 포함한다. 제 1 디바이스 (204) 는 도 1 의 제 1 디바이스 (104) 에 대응할 수도 있다. 시스템 (200) 은 제 1 디바이스 (204) 가 2개보다 많은 마이크로폰들에 커플링된다는 점에서, 도 1 의 시스템 (100) 과는 상이하다. 예를 들어, 제 1 디바이스 (204) 는 제 1 마이크로폰 (146), 제 N 마이크로폰 (248), 및 하나 이상의 추가적인 마이크로폰들 (예컨대, 도 1 의 제 2 마이크로폰 (148)) 에 커플링될 수도 있다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142), 제 Y 라우드스피커 (244), 하나 이상의 추가적인 스피커들 (예컨대, 제 2 라우드스피커 (144)), 또는 이들의 조합에 커플링될 수도 있다. 제 1 디바이스 (204) 는 인코더 (214) 를 포함할 수도 있다. 인코더 (214) 는 도 1 의 인코더 (114) 에 대응할 수도 있다. 인코더 (214) 는 하나 이상의 시간 등화기들 (208) 을 포함할 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 도 1 의 시간 등화기 (108) 를 포함할 수도 있다.
동작 동안, 제 1 디바이스 (204) 는 2개보다 많은 오디오 신호들을 수신할 수도 있다. 예를 들어, 제 1 디바이스 (204) 는 제 1 마이크로폰 (146) 을 통해서 제 1 오디오 신호 (130) 를, 제 N 마이크로폰 (248) 을 통해서 제 N 오디오 신호 (232) 를, 그리고, 추가적인 마이크로폰들 (예컨대, 제 2 마이크로폰 (148)) 을 통해서 하나 이상의 추가적인 오디오 신호들 (예컨대, 제 2 오디오 신호 (132)) 을 수신할 수도 있다.
시간 등화기(들) (208) 는, 도 14 내지 도 15 를 참조하여 추가로 설명되는 바와 같이, 하나 이상의 참조 신호 표시자들 (264), 최종 시프트 값들 (216), 비-인과적 시프트 값들 (262), 이득 파라미터들 (260), 인코딩된 신호들 (202), 또는 이들의 조합을 발생시킬 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 가 참조 신호라고, 그리고, 제 N 오디오 신호 (232) 및 추가적인 오디오 신호들 각각이 목표 신호라고 결정할 수도 있다. 시간 등화기(들) (208) 는, 도 14 를 참조하여 설명되는 바와 같이, 참조 신호 표시자 (164), 최종 시프트 값들 (216), 비-인과적 시프트 값들 (262), 이득 파라미터들 (260), 및 제 1 오디오 신호 (130) 및 제 N 오디오 신호 (232) 및 추가적인 오디오 신호들 각각에 대응하는 인코딩된 신호들 (202) 을 발생시킬 수도 있다.
참조 신호 표시자들 (264) 은 참조 신호 표시자 (164) 를 포함할 수도 있다. 최종 시프트 값들 (216) 은, 도 14 를 참조하여 추가로 설명되는 바와 같이, 제 1 오디오 신호 (130) 에 대한 제 2 오디오 신호 (132) 의 시프트를 표시하는 최종 시프트 값 (116), 제 1 오디오 신호 (130) 에 대한 제 N 오디오 신호 (232) 의 시프트를 표시하는 제 2 최종 시프트 값, 또는 양자를 포함할 수도 있다. 비-인과적 시프트 값들 (262) 은, 도 14 를 참조하여 추가로 설명되는 바와 같이, 최종 시프트 값 (116) 의 절대값에 대응하는 비-인과적 시프트 값 (162), 제 2 최종 시프트 값의 절대값에 대응하는 제 2 비-인과적 시프트 값, 또는 양자를 포함할 수도 있다. 이득 파라미터들 (260) 은, 도 14 를 참조하여 추가로 설명되는 바와 같이, 제 2 오디오 신호 (132) 의 선택된 샘플들의 이득 파라미터 (160), 제 N 오디오 신호 (232) 의 선택된 샘플들의 제 2 이득 파라미터, 또는 양자를 포함할 수도 있다. 인코딩된 신호들 (202) 은 인코딩된 신호들 (102) 중 적어도 하나를 포함할 수도 있다. 예를 들어, 인코딩된 신호들 (202) 은, 도 14 를 참조하여 추가로 설명되는 바와 같이, 제 1 오디오 신호 (130) 의 제 1 샘플들 및 제 2 오디오 신호 (132) 의 선택된 샘플들에 대응하는 사이드 채널 신호, 제 N 오디오 신호 (232) 의 제 1 샘플들 및 선택된 샘플들에 대응하는 제 2 사이드 채널, 또는 양자를 포함할 수도 있다. 인코딩된 신호들 (202) 은, 도 14 를 참조하여 추가로 설명되는 바와 같이, 제 1 샘플들에 대응하는 중간 채널 신호, 제 2 오디오 신호 (132) 의 선택된 샘플들, 및 제 N 오디오 신호 (232) 의 선택된 샘플들을 포함할 수도 있다.
일부 구현예들에서, 시간 등화기(들) (208) 는 도 15 를 참조하여 설명된 바와 같이, 다수의 참조 신호들 및 대응하는 목표 신호들을 결정할 수도 있다. 예를 들어, 참조 신호 표시자들 (264) 은 참조 신호 및 목표 신호의 각각의 쌍에 대응하는 참조 신호 표시자를 포함할 수도 있다. 예시하기 위하여, 참조 신호 표시자들 (264) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 대응하는 참조 신호 표시자 (164) 를 포함할 수도 있다. 최종 시프트 값들 (216) 은 참조 신호 및 목표 신호의 각각의 쌍에 대응하는 최종 시프트 값을 포함할 수도 있다. 예를 들어, 최종 시프트 값들 (216) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 대응하는 최종 시프트 값 (116) 을 포함할 수도 있다. 비-인과적 시프트 값들 (262) 은 참조 신호 및 목표 신호의 각각의 쌍에 대응하는 비-인과적 시프트 값을 포함할 수도 있다. 예를 들어, 비-인과적 시프트 값들 (262) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 대응하는 비-인과적 시프트 값 (162) 을 포함할 수도 있다. 이득 파라미터들 (260) 은 참조 신호 및 목표 신호의 각각의 쌍에 대응하는 이득 파라미터를 포함할 수도 있다. 예를 들어, 이득 파라미터들 (260) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 대응하는 이득 파라미터 (160) 를 포함할 수도 있다. 인코딩된 신호들 (202) 은 참조 신호 및 목표 신호의 각각의 쌍에 대응하는 중간 채널 신호 및 사이드 채널 신호를 포함할 수도 있다. 예를 들어, 인코딩된 신호들 (202) 은 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 대응하는 인코딩된 신호들 (102) 을 포함할 수도 있다.
송신기 (110) 는 참조 신호 표시자들 (264), 비-인과적 시프트 값들 (262), 이득 파라미터들 (260), 인코딩된 신호들 (202), 또는 이들의 조합을, 네트워크 (120) 를 통해서, 제 2 디바이스 (106) 로 송신할 수도 있다. 디코더 (118) 는 참조 신호 표시자들 (264), 비-인과적 시프트 값들 (262), 이득 파라미터들 (260), 인코딩된 신호들 (202), 또는 이들의 조합에 기초하여, 하나 이상의 출력 신호들을 발생시킬 수도 있다. 예를 들어, 디코더 (118) 는 제 1 라우드스피커 (142) 를 통하여 제 1 출력 신호 (226) 를, 제 Y 라우드스피커 (244) 를 통하여 제 Y 출력 신호 (228) 를, 하나 이상의 추가적인 라우드스피커들 (예컨대, 제 2 라우드스피커 (144)) 을 통하여 하나 이상의 추가적인 출력 신호들 (예컨대, 제 2 출력 신호 (128)) 을, 또는 이들의 조합을 출력할 수도 있다.
따라서, 시스템 (200) 은 시간 등화기(들) (208) 로 하여금, 2개보다 많은 오디오 신호들을 인코딩하게 할 수도 있다. 예를 들어, 인코딩된 신호들 (202) 은 비-인과적 시프트 값들 (262) 에 기초하여 사이드 채널 신호들을 발생시킴으로써, 대응하는 중간 채널들 보다 더 적은 비트들을 이용하여 인코딩된 다수의 사이드 채널 신호들을 포함할 수도 있다.
도 3 을 참조하면, 샘플들의 예시적인 예들이 도시되며, 일반적으로 300 으로 지정된다. 적어도 샘플들 (300) 의 서브세트는 본원에서 설명하는 바와 같이, 제 1 디바이스 (104) 에 의해 인코딩될 수도 있다.
샘플들 (300) 은 제 1 오디오 신호 (130) 에 대응하는 제 1 샘플들 (320), 제 2 오디오 신호 (132) 에 대응하는 제 2 샘플들 (350), 또는 양자를 포함할 수도 있다. 제 1 샘플들 (320) 은 샘플 (322), 샘플 (324), 샘플 (326), 샘플 (328), 샘플 (330), 샘플 (332), 샘플 (334), 샘플 (336), 하나 이상의 추가적인 샘플들, 또는 이들의 조합을 포함할 수도 있다. 제 2 샘플들 (350) 은 샘플 (352), 샘플 (354), 샘플 (356), 샘플 (358), 샘플 (360), 샘플 (362), 샘플 (364), 샘플 (366), 하나 이상의 추가적인 샘플들, 또는 이들의 조합을 포함할 수도 있다.
제 1 오디오 신호 (130) 는 복수의 프레임들 (예컨대, 프레임 (302), 프레임 (304), 프레임 (306), 또는 이들의 조합) 에 대응할 수도 있다. 복수의 프레임들의 각각은 제 1 샘플들 (320) 의 (예컨대, 32 kHz 에서의 640 개의 샘플들 또는 48 kHz 에서의 960 개의 샘플들과 같은, 20 ms 에 대응하는) 샘플들의 서브세트에 대응할 수도 있다. 예를 들어, 프레임 (302) 은 샘플 (322), 샘플 (324), 하나 이상의 추가적인 샘플들, 또는 이들의 조합에 대응할 수도 있다. 프레임 (304) 은 샘플 (326), 샘플 (328), 샘플 (330), 샘플 (332), 하나 이상의 추가적인 샘플들, 또는 이들의 조합에 대응할 수도 있다. 프레임 (306) 은 샘플 (334), 샘플 (336), 하나 이상의 추가적인 샘플들, 또는 이들의 조합에 대응할 수도 있다.
샘플 (322) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (352) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (324) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (354) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (326) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (356) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (328) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (358) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (330) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (360) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (332) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (362) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (334) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (364) 과 대략 동일한 시간에 수신될 수도 있다. 샘플 (336) 은 도 1 의 입력 인터페이스(들) (112) 에서 샘플 (366) 과 대략 동일한 시간에 수신될 수도 있다.
최종 시프트 값 (116) 의 제 1 값 (예컨대, 포지티브 값) 은 제 1 오디오 신호 (130) 에 대한 제 2 오디오 신호 (132) 의 시간 지연을 표시하는, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합의 양을 표시할 수도 있다. 예를 들어, 최종 시프트 값 (116) 의 제 1 값 (예컨대, +X ms 또는 +Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 은 프레임 (304) (예컨대, 샘플들 (326-332)) 이 샘플들 (358-364) 에 대응한다는 것을 표시할 수도 있다. 제 2 오디오 신호 (132) 의 샘플들 (358-364) 은 샘플들 (326-332) 보다 시간적으로 지연될 수도 있다. 샘플들 (326-332) 및 샘플들 (358-364) 은 사운드 소스 (152) 로부터 방출된 동일한 사운드에 대응할 수도 있다. 샘플들 (358-364) 은 제 2 오디오 신호 (132) 의 프레임 (344) 에 대응할 수도 있다. 도 1 내지 도 15 중 하나 이상에서 크로스-해칭을 가지는 샘플들의 예시는 샘플들이 동일한 사운드에 대응한다는 것을 표시할 수도 있다. 예를 들어, 샘플들 (326-332) 및 샘플들 (358-364) 은 샘플들 (326-332) (예컨대, 프레임 (304)) 및 샘플들 (358-364) (예컨대, 프레임 (344)) 이 사운드 소스 (152) 로부터 방출된 동일한 사운드에 대응한다는 것을 표시하기 위해, 도 3 에 크로스-해칭으로 예시된다.
도 3 에 나타낸 바와 같이, Y 샘플들의 시간 오프셋은 예시적인 것으로 이해되어야 한다. 예를 들어, 시간 오프셋은 0 보다 크거나 같은 샘플들의 수 Y 에 대응할 수도 있다. 시간 오프셋 Y = 0 샘플들인 제 1 경우, (예컨대, 프레임 (304) 에 대응하는) 샘플들 (326-332) 및 (예컨대, 프레임 (344) 에 대응하는) 샘플들 (356-362) 은 임의의 프레임 오프셋 없이 높은 유사도를 나타낼 수도 있다. 시간 오프셋 Y = 2 샘플들인 제 2 경우, 프레임 (304) 및 프레임 (344) 은 2 개의 샘플들 만큼 오프셋될 수도 있다. 이 경우, 제 1 오디오 신호 (130) 는 입력 인터페이스(들) (112) 에서 제 2 오디오 신호 (132) 이전에 Y = 2 샘플들 또는 X = (2/Fs) ms 만큼 수신될 수도 있으며, 여기서, Fs 는 kHz 단위의 샘플 레이트에 대응한다. 일부의 경우, 시간 오프셋 Y 는 비-정수 값, 예컨대, 32 kHz 에서의 X = 0.05 ms 에 대응하는 Y = 1.6 샘플들을 포함할 수도 있다.
도 1 의 시간 등화기 (108) 는 최종 시프트 값 (116) 에 기초하여, 제 1 오디오 신호 (130) 가 참조 신호에 대응한다고, 그리고, 제 2 오디오 신호 (132) 가 목표 신호에 대응한다고 결정할 수도 있다. 참조 신호 (예컨대, 제 1 오디오 신호 (130)) 는 선행 신호에 대응할 수도 있으며, 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 는 지체된 신호에 대응할 수도 있다. 예를 들어, 제 1 오디오 신호 (130) 는 최종 시프트 값 (116) 에 기초하여 제 1 오디오 신호 (130) 에 대해 제 2 오디오 신호 (132) 를 시프트시킴으로써 참조 신호로서 취급될 수도 있다.
시간 등화기 (108) 는 샘플들 (326-332) 이 (샘플들 (356-362) 과 비교하여) 샘플들 (358-264) 로 인코딩될 것임을 표시하기 위해, 제 2 오디오 신호 (132) 를 시프트시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 샘플들 (358-364) 의 로케이션들을 샘플들 (356-362) 의 로케이션들로 시프트시킬 수도 있다. 시간 등화기 (108) 는 샘플들 (358-364) 의 로케이션들을 표시하기 위해 샘플들 (356-362) 의 로케이션들을 표시하는 것으로부터 하나 이상의 포인터들을 업데이트할 수도 있다. 시간 등화기 (108) 는 샘플들 (356-362) 에 대응하는 데이터를 복사하는 것과 비교하여, 샘플들 (358-364) 에 대응하는 데이터를 버퍼로 복사할 수도 있다. 시간 등화기 (108) 는 도 1 을 참조하여 설명된 바와 같이, 샘플들 (326-332) 및 샘플들 (358-364) 을 인코딩함으로써, 인코딩된 신호들 (102) 을 발생시킬 수도 있다.
도 4 를 참조하면, 샘플들의 예시적인 예들이 도시되며, 일반적으로 400 으로서 지정된다. 예들 (400) 은 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 지연된다는 점에서, 예들 (300) 과는 상이하다.
최종 시프트 값 (116) 의 제 2 값 (예컨대, 네거티브 값) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합의 양이 제 2 오디오 신호 (132) 에 대한 제 1 오디오 신호 (130) 의 시간 지연을 표시한다는 것을 표시할 수도 있다. 예를 들어, 최종 시프트 값 (116) 의 제 2 값 (예컨대, -X ms 또는 -Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 은 프레임 (304) (예컨대, 샘플들 (326-332)) 이 샘플들 (354-360) 에 대응한다는 것을 표시할 수도 있다. 샘플들 (354-360) 은 제 2 오디오 신호 (132) 의 프레임 (344) 에 대응할 수도 있다. 샘플들 (326-332) 은 샘플들 (354-360) 에 대해 시간적으로 지연된다. 샘플들 (354-360) (예컨대, 프레임 (344)) 및 샘플들 (326-332) (예컨대, 프레임 (304)) 은 사운드 소스 (152) 로부터 방출된 동일한 사운드에 대응할 수도 있다.
도 4 에 나타낸 바와 같은, -Y 샘플들의 시간 오프셋은 예시적인 것으로 이해되어야 한다. 예를 들어, 시간 오프셋은 0 이하인 샘플들의 수 -Y 에 대응할 수도 있다. 시간 오프셋 Y = 0 샘플들인 제 1 경우, (예컨대, 프레임 (304) 에 대응하는) 샘플들 (326-332) 및 (예컨대, 프레임 (344) 에 대응하는) 샘플들 (356-362) 은 임의의 프레임 오프셋 없이 높은 유사도를 나타낼 수도 있다. 시간 오프셋 Y = -6 샘플들인 제 2 경우, 프레임 (304) 및 프레임 (344) 은 6 개의 샘플들 만큼 오프셋될 수도 있다. 이 경우, 제 1 오디오 신호 (130) 는 입력 인터페이스(들) (112) 에서 Y = -6 샘플들 또는 X = (-6/Fs) ms 만큼 제 2 오디오 신호 (132) 에 후속하여 수신될 수도 있으며, 여기서, Fs 는 kHz 단위의 샘플 레이트에 대응한다. 일부의 경우, 시간 오프셋 Y 는 비-정수 값, 예컨대, 32 kHz 에서의 X = -0.1 ms 에 대응하는 Y = -3.2 샘플들을 포함할 수도 있다.
도 1 의 시간 등화기 (108) 는 제 2 오디오 신호 (132) 가 참조 신호에 대응한다고, 그리고, 제 1 오디오 신호 (130) 가 목표 신호에 대응한다고 결정할 수도 있다. 특히, 시간 등화기 (108) 는 도 5 를 참조하여 설명되는 바와 같이, 최종 시프트 값 (116) 으로부터 비-인과적 시프트 값 (162) 을 추정할 수도 있다. 시간 등화기 (108) 는 최종 시프트 값 (116) 의 부호에 기초하여, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 하나를 참조 신호로서, 그리고, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 다른 하나를 목표 신호로서 식별 (예컨대, 지정) 할 수도 있다.
참조 신호 (예컨대, 제 2 오디오 신호 (132)) 는 선행 신호에 대응할 수도 있으며, 목표 신호 (예컨대, 제 1 오디오 신호 (130)) 는 지체된 신호에 대응할 수도 있다. 예를 들어, 제 2 오디오 신호 (132) 는 최종 시프트 값 (116) 에 기초하여 제 2 오디오 신호 (132) 에 대해 제 1 오디오 신호 (130) 를 시프트시킴으로써 참조 신호로서 취급될 수도 있다.
시간 등화기 (108) 는 샘플들 (354-360) 이 (샘플들 (324-330) 과 비교하여) 샘플들 (326-332) 로 인코딩될 것임을 표시하기 위해 제 1 오디오 신호 (130) 를 시프트시킬 수도 있다. 예를 들어, 시간 등화기 (108) 는 샘플들 (326-332) 의 로케이션들을 샘플들 (324-330) 의 로케이션들로 시프트시킬 수도 있다. 시간 등화기 (108) 는 샘플들 (326-332) 의 로케이션들을 표시하기 위해 샘플들 (324-330) 의 로케이션들을 표시하는 것으로부터 하나 이상의 포인터들을 업데이트할 수도 있다. 시간 등화기 (108) 는 샘플들 (324-330) 에 대응하는 데이터를 복사하는 것과 비교하여, 샘플들 (326-332) 에 대응하는 데이터를 버퍼로 복사할 수도 있다. 시간 등화기 (108) 는 도 1 을 참조하여 설명된 바와 같이, 샘플들 (354-360) 및 샘플들 (326-332) 을 인코딩함으로써, 인코딩된 신호들 (102) 을 발생시킬 수도 있다.
도 5 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 500 으로 지정된다. 시스템 (500) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는, 시스템 (500) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 시간 등화기 (108) 는 리샘플러 (504), 신호 비교기 (506), 보간기 (510), 시프트 정제기 (511), 시프트 변화 분석기 (512), 절대 시프트 발생기 (513), 참조 신호 지정기 (508), 이득 파라미터 발생기 (514), 신호 발생기 (516), 또는 이들의 조합을 포함할 수도 있다.
동작 동안, 리샘플러 (504) 는 도 6 을 참조하여 더 설명되는 바와 같이, 하나 이상의 리샘플링된 신호들을 발생시킬 수도 있다. 예를 들어, 리샘플러 (504) 는 리샘플링 (예컨대, 다운샘플링 또는 업샘플링) 인자 (D) (예컨대, ≥ 1) 에 기초하여, 제 1 오디오 신호 (130) 를 리샘플링 (예컨대, 다운샘플링 또는 업샘플링) 함으로써, 제 1 리샘플링된 신호 (530) (다운샘플링된 신호 또는 업샘플링된 신호) 를 발생시킬 수도 있다. 리샘플러 (504) 는 리샘플링 인자 (D) 에 기초하여 제 2 오디오 신호 (132) 를 리샘플링함으로써 제 2 리샘플링된 신호 (532) 를 발생시킬 수도 있다. 리샘플러 (504) 는 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 또는 양자를, 신호 비교기 (506) 에 제공할 수도 있다.
신호 비교기 (506) 는 도 7 을 참조하여 더 설명되는 바와 같이, 비교 값들 (534) (예컨대, 차이 값들, 유사도 값들, 코히어런스 값들, 또는 교차-상관 값들), 임시 시프트 값 (536) (예컨대, 임시 부정합 값), 또는 양자를 발생시킬 수도 있다. 예를 들어, 신호 비교기 (506) 는 도 7 을 참조하여 더 설명되는 바와 같이, 제 1 리샘플링된 신호 (530) 및 제 2 리샘플링된 신호 (532) 에 적용된 복수의 시프트 값들에 기초하여, 비교 값들 (534) 을 발생시킬 수도 있다. 신호 비교기 (506) 는 도 7 을 참조하여 더 설명되는 바와 같이, 비교 값들 (534) 에 기초하여, 임시 시프트 값 (536) 을 결정할 수도 있다. 제 1 리샘플링된 신호 (530) 는 제 1 오디오 신호 (130) 보다 더 적은 샘플들 또는 더 많은 샘플들을 포함할 수도 있다. 제 2 리샘플링된 신호 (532) 는 제 2 오디오 신호 (132) 보다 더 적은 샘플들 또는 더 많은 샘플들을 포함할 수도 있다. 대안적인 양태에서, 제 1 리샘플링된 신호 (530) 는 제 1 오디오 신호 (130) 와 동일할 수도 있으며, 제 2 리샘플링된 신호 (532) 는 제 2 오디오 신호 (132) 와 동일할 수도 있다. 리샘플링된 신호들 (예컨대, 제 1 리샘플링된 신호 (530) 및 제 2 리샘플링된 신호 (532)) 의 더 적은 샘플들에 기초하여 비교 값들 (534) 을 결정하는 것은 원래 신호들 (예컨대, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 의 샘플들 보다 더 적은 리소스들 (예컨대, 시간, 동작들의 수, 또는 양자) 을 이용할 수도 있다. 리샘플링된 신호들 (예컨대, 제 1 리샘플링된 신호 (530) 및 제 2 리샘플링된 신호 (532)) 의 더 많은 샘플들에 기초하여 비교 값들 (534) 을 결정하는 것은 원래 신호들 (예컨대, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 의 샘플들 보다 정밀도를 증가시킬 수도 있다. 신호 비교기 (506) 는 비교 값들 (534), 임시 시프트 값 (536), 또는 양자를, 보간기 (510) 에 제공할 수도 있다.
보간기 (510) 는 임시 시프트 값 (536) 을 확장할 수도 있다. 예를 들어, 보간기 (510) 는 도 8 을 참조하여 더 설명되는 바와 같이, 보간된 시프트 값 (538) (예컨대, 보간된 부정합 값) 을 발생시킬 수도 있다. 예를 들어, 보간기 (510) 는 비교 값들 (534) 을 보간함으로써 임시 시프트 값 (536) 에 가장 가까운 시프트 값들에 대응하는 보간된 비교 값들을 발생시킬 수도 있다. 보간기 (510) 는 보간된 비교 값들 및 비교 값들 (534) 에 기초하여, 보간된 시프트 값 (538) 을 결정할 수도 있다. 비교 값들 (534) 은 시프트 값들의 더 조악한 그래뉼래러티에 기초할 수도 있다. 예를 들어, 비교 값들 (534) 은 제 1 서브세트의 제 1 시프트 값과 제 1 서브세트의 각각의 제 2 시프트 값 사이의 차이가 임계치 이상 (예컨대, ≥1) 이 되도록, 시프트 값들의 세트의 제 1 서브세트에 기초할 수도 있다. 임계치는 리샘플링 인자 (D) 에 기초할 수도 있다.
보간된 비교 값들은 리샘플링된 임시 시프트 값 (536) 에 가장 가까운 시프트 값들의 더 미세한 그래뉼래러티에 기초할 수도 있다. 예를 들어, 보간된 비교 값들은 제 2 서브세트의 최고 시프트 값과 리샘플링된 임시 시프트 값 (536) 사이의 차이가 임계치 미만 (예컨대, ≥1) 이 되도록, 그리고 제 2 서브세트의 최저 시프트 값과 리샘플링된 임시 시프트 값 (536) 사이의 차이가 임계치 미만이 되도록, 시프트 값들의 세트의 제 2 서브세트에 기초할 수도 있다. 시프트 값들의 세트의 더 조악한 그래뉼래러티 (예컨대, 제 1 서브세트) 에 기초하여 비교 값들 (534) 을 결정하는 것은, 시프트 값들의 세트의 더 미세한 그래뉼래러티 (예컨대, 모두) 에 기초하여 비교 값들 (534) 을 결정하는 것 보다 더 적은 리소스들 (예컨대, 시간, 동작들, 또는 양자) 을 이용할 수도 있다. 시프트 값들의 제 2 서브세트에 대응하는 보간된 비교 값들을 결정하는 것은, 시프트 값들의 세트의 각각의 시프트 값에 대응하는 비교 값들을 결정함이 없이, 임시 시프트 값 (536) 에 가장 가까운 시프트 값들의 더 작은 세트의 더 미세한 그래뉼래러티에 기초하여, 임시 시프트 값 (536) 을 확장할 수도 있다. 따라서, 시프트 값들의 제 1 서브세트에 기초하여 임시 시프트 값 (536) 을 결정하는 것, 및 보간된 비교 값들에 기초하여 보간된 시프트 값 (538) 을 결정하는 것은, 리소스 사용과 추정된 시프트 값의 정제를 조화시킬 수도 있다. 보간기 (510) 는 보간된 시프트 값 (538) 을 시프트 정제기 (511) 에 제공할 수도 있다.
시프트 정제기 (511) 는 도 9a 내지 도 9c 를 참조하여 더욱 설명되는 바와 같이, 보간된 시프트 값 (538) 을 정제함으로써, 정정된 시프트 값 (540) 을 발생시킬 수도 있다. 예를 들어, 시프트 정제기 (511) 는 도 9a 를 참조하여 더 설명되는 바와 같이, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시프트에서의 변화가 시프트 변화 임계치보다 크다는 것을 보간된 시프트 값 (538) 이 표시하는지 여부를 결정할 수도 있다. 시프트에서의 변화는 보간된 시프트 값 (538) 및 도 3 의 프레임 (302) 과 연관된 제 1 시프트 값 사이의 차이로 표시될 수도 있다. 시프트 정제기 (511) 는 차이가 임계치 이하라고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 을 보간된 시프트 값 (538) 으로 설정할 수도 있다. 대안적으로, 시프트 정제기 (511) 는 도 9a 를 참조하여 더 설명되는 바와 같이, 차이가 임계치 보다 크다고 결정하는 것에 응답하여, 시프트 변화 임계치 이하인 차이에 대응하는 복수의 시프트 값들을 결정할 수도 있다. 시프트 정제기 (511) 는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 복수의 시프트 값들에 기초하여 비교 값들을 결정할 수도 있다. 시프트 정제기 (511) 는 도 9a 를 참조하여 더 설명되는 바와 같이, 비교 값들에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다. 예를 들어, 시프트 정제기 (511) 는 도 9a 를 참조하여 더 설명되는 바와 같이, 비교 값들 및 보간된 시프트 값 (538) 에 기초하여, 복수의 시프트 값들의 시프트 값을 선택할 수도 있다. 시프트 정제기 (511) 는 정정된 시프트 값 (540) 을 선택된 시프트 값을 표시하도록 설정할 수도 있다. 프레임 (302) 에 대응하는 제 1 시프트 값과 보간된 시프트 값 (538) 사이의 비-제로 차이는 제 2 오디오 신호 (132) 의 일부 샘플들이 프레임들 양자 (예컨대, 프레임 (302) 및 프레임 (304)) 에 대응한다는 것을 표시할 수도 있다. 예를 들어, 제 2 오디오 신호 (132) 의 일부 샘플들은 인코딩 동안 중복될 수도 있다. 대안적으로, 비-제로 차이는 제 2 오디오 신호 (132) 의 일부 샘플들이 프레임 (302) 도 프레임 (304) 에도 대응하지 않는다는 것을 표시할 수도 있다. 예를 들어, 제 2 오디오 신호 (132) 의 일부 샘플들은 인코딩 동안 손실될 수도 있다. 정정된 시프트 값 (540) 을 복수의 시프트 값들 중 하나로 설정하는 것은, 연속된 (또는, 인접한) 프레임들 사이의 시프트들에서의 큰 변화를 방지하고, 이에 의해, 인코딩 동안 샘플 손실 또는 샘플 중복의 양을 감소시킬 수도 있다. 시프트 정제기 (511) 는 정정된 시프트 값 (540) 을 시프트 변화 분석기 (512) 에 제공할 수도 있다.
일부 구현예들에서, 시프트 정제기 (511) 는 도 9b 를 참조하여 설명되는 바와 같이, 보간된 시프트 값 (538) 을 조정할 수도 있다. 시프트 정제기 (511) 는 조정된 보간된 시프트 값 (538) 에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다. 일부 구현예들에서, 시프트 정제기 (511) 는 도 9c 를 참조하여 설명되는 바와 같이, 정정된 시프트 값 (540) 을 결정할 수도 있다.
시프트 변화 분석기 (512) 는 도 1 을 참조하여 설명된 바와 같이, 정정된 시프트 값 (540) 이 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 타이밍에서의 스위칭 또는 역전을 표시하는지 여부를 결정할 수도 있다. 특히, 타이밍에서의 역전 또는 스위칭은, 프레임 (302) 에 대해, 제 1 오디오 신호 (130) 가 입력 인터페이스(들) (112) 에서 제 2 오디오 신호 (132) 이전에 수신되고, 그리고, 후속 프레임 (예컨대, 프레임 (304) 또는 프레임 (306)) 에 대해, 제 2 오디오 신호 (132) 가 입력 인터페이스(들) 에서 제 1 오디오 신호 (130) 이전에 수신된다는 것을 표시할 수도 있다. 대안적으로, 타이밍에서의 역전 또는 스위칭은, 프레임 (302) 에 대해, 제 2 오디오 신호 (132) 가 입력 인터페이스(들) (112) 에서 제 1 오디오 신호 (130) 이전에 수신되고, 그리고, 후속 프레임 (예컨대, 프레임 (304) 또는 프레임 (306)) 에 대해, 제 1 오디오 신호 (130) 가 입력 인터페이스(들) 에서 제 2 오디오 신호 (132) 이전에 수신된다는 것을 표시할 수도 있다. 다시 말해서, 타이밍에서의 스위칭 또는 역전은 프레임 (302) 에 대응하는 최종 시프트 값이 프레임 (304) 에 대응하는 정정된 시프트 값 (540) 의 제 2 부호와는 상이한 제 1 부호를 갖는다는 것을 표시할 수도 있다 (예컨대, 포지티브로부터 네거티브로의 전이 또는 반대도 마찬가지이다). 시프트 변화 분석기 (512) 는 도 10a 를 참조하여 더 설명되는 바와 같이, 정정된 시프트 값 (540) 및 프레임 (302) 과 연관된 제 1 시프트 값에 기초하여, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였는지 여부를 결정할 수도 있다. 시프트 변화 분석기 (512) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하였다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 을 시간 시프트 없음을 표시하는 값 (예컨대, 0) 으로 설정할 수도 있다. 대안적으로, 시프트 변화 분석기 (512) 는 도 10a 를 참조하여 더 설명되는 바와 같이, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 부호를 스위칭하지 않았다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 을 정정된 시프트 값 (540) 으로 설정할 수도 있다. 시프트 변화 분석기 (512) 는 도 10a 및 도 11 을 참조하여 더욱 설명되는 바와 같이, 정정된 시프트 값 (540) 을 정제함으로써, 추정된 시프트 값을 발생시킬 수도 있다. 시프트 변화 분석기 (512) 는 최종 시프트 값 (116) 을 추정된 시프트 값으로 설정할 수도 있다. 최종 시프트 값 (116) 을 시간 시프트 없음을 표시하도록 설정하는 것은, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 를 제 1 오디오 신호 (130) 의 연속된 (또는, 인접한) 프레임들에 대해 반대 방향들로 시간 시프트하는 것을 억제함으로써, 디코더에서 왜곡을 감소시킬 수도 있다. 시프트 변화 분석기 (512) 는 최종 시프트 값 (116) 을 참조 신호 지정기 (508), 절대 시프트 발생기 (513), 또는 양자에 제공할 수도 있다. 일부 구현예들에서, 시프트 변화 분석기 (512) 는 도 10b 를 참조하여 설명되는 바와 같이, 최종 시프트 값 (116) 을 결정할 수도 있다.
절대 시프트 발생기 (513) 는 절대 함수를 최종 시프트 값 (116) 에 적용함으로써 비-인과적 시프트 값 (162) 을 발생시킬 수도 있다. 절대 시프트 발생기 (513) 는 비-인과적 시프트 값 (162) 을 이득 파라미터 발생기 (514) 에 제공할 수도 있다.
참조 신호 지정기 (508) 는 도 12 내지 도 13 을 참조하여 더욱 설명되는 바와 같이, 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 예를 들어, 참조 신호 표시자 (164) 는 제 1 오디오 신호 (130) 가 참조 신호라는 것을 표시하는 제 1 값 또는 제 2 오디오 신호 (132) 가 참조 신호라는 것을 표시하는 제 2 값을 가질 수도 있다. 참조 신호 지정기 (508) 는 참조 신호 표시자 (164) 를 이득 파라미터 발생기 (514) 에 제공할 수도 있다.
이득 파라미터 발생기 (514) 는 비-인과적 시프트 값 (162) 에 기초하여, 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 의 샘플들을 선택할 수도 있다. 예를 들어, 이득 파라미터 발생기 (514) 는 비-인과적 시프트 값 (162) 에 기초하여 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 를 시프트시킴으로써 시간-시프트된 목표 신호 (예컨대, 시간-시프트된 제 2 오디오 신호) 를 발생시킬 수도 있으며, 시간-시프트된 목표 신호의 샘플들을 선택할 수도 있다. 예시하기 위하여, 이득 파라미터 발생기 (514) 는 비-인과적 시프트 값 (162) 이 제 1 값 (예컨대, +X ms 또는 +Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 을 갖는다고 결정하는 것에 응답하여, 샘플들 (358-364) 을 선택할 수도 있다. 이득 파라미터 발생기 (514) 는 비-인과적 시프트 값 (162) 이 제 2 값 (예컨대, -X ms 또는 -Y 샘플들) 을 갖는다고 결정하는 것에 응답하여, 샘플들 (354-360) 을 선택할 수도 있다. 이득 파라미터 발생기 (514) 는 비-인과적 시프트 값 (162) 이 시간 시프트 없음을 표시하는 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 샘플들 (356-362) 을 선택할 수도 있다.
이득 파라미터 발생기 (514) 는 참조 신호 표시자 (164) 에 기초하여, 제 1 오디오 신호 (130) 가 참조 신호인지 또는 제 2 오디오 신호 (132) 가 참조 신호인지 여부를 결정할 수도 있다. 이득 파라미터 발생기 (514) 는 도 1 을 참조하여 설명된 바와 같이, 프레임 (304) 의 샘플들 (326-332) 및 제 2 오디오 신호 (132) 의 선택된 샘플들 (예컨대, 샘플들 (354-360), 샘플들 (356-362), 또는 샘플들 (358-364)) 에 기초하여, 이득 파라미터 (160) 를 발생시킬 수도 있다. 예를 들어, 이득 파라미터 발생기 (514) 는 수식 1a - 수식 1f 중 하나 이상에 기초하여 이득 파라미터 (160) 를 발생시킬 수도 있으며, 여기서, gD 는 이득 파라미터 (160) 에 대응하며, Ref(n) 은 참조 신호의 샘플들에 대응하며, Targ(n+N1) 은 목표 신호의 샘플들에 대응한다. 예시하기 위하여, 비-인과적 시프트 값 (162) 이 제 1 값 (예컨대, +X ms 또는 +Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 을 가질 때, Ref(n) 은 프레임 (304) 의 샘플들 (326-332) 에 대응할 수도 있으며 Targ(n+tN1) 은 프레임 (344) 의 샘플들 (358-364) 에 대응할 수도 있다. 일부 구현예들에서, 도 1 을 참조하여 설명된 바와 같이, Ref(n) 은 제 1 오디오 신호 (130) 의 샘플들에 대응할 수도 있으며, Targ(n+N1) 은 제 2 오디오 신호 (132) 의 샘플들에 대응할 수도 있다. 대안적인 구현예들에서, 도 1 을 참조하여 설명된 바와 같이, Ref(n) 은 제 2 오디오 신호 (132) 의 샘플들에 대응할 수도 있으며, Targ(n+N1) 은 제 1 오디오 신호 (130) 의 샘플들에 대응할 수도 있다.
이득 파라미터 발생기 (514) 는 이득 파라미터 (160), 참조 신호 표시자 (164), 비-인과적 시프트 값 (162), 또는 이들의 조합을, 신호 발생기 (516) 에 제공할 수도 있다. 신호 발생기 (516) 는 도 1 을 참조하여 설명된 바와 같이, 인코딩된 신호들 (102) 을 발생시킬 수도 있다. 예를 들면, 인코딩된 신호들 (102) 은 제 1 인코딩된 신호 프레임 (564) (예컨대, 중간 채널 프레임), 제 2 인코딩된 신호 프레임 (566) (예컨대, 사이드 채널 프레임), 또는 양자를 포함할 수도 있다. 신호 발생기 (516) 는 수식 2a 또는 수식 2b 에 기초하여 제 1 인코딩된 신호 프레임 (564) 을 발생시킬 수도 있으며, 여기서, M 은 제 1 인코딩된 신호 프레임 (564) 에 대응하며, gD 는 이득 파라미터 (160) 에 대응하며, Ref(n) 은 참조 신호의 샘플들에 대응하며, Targ(n+N1) 은 목표 신호의 샘플들에 대응한다. 신호 발생기 (516) 는 수식 3a 또는 수식 3b 에 기초하여 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있으며, 여기서, S 는 제 2 인코딩된 신호 프레임 (566) 에 대응하며, gD 는 이득 파라미터 (160) 에 대응하며, Ref(n) 은 참조 신호의 샘플들에 대응하며, Targ(n+N1) 은 목표 신호의 샘플들에 대응한다.
시간 등화기 (108) 는 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 비교 값들 (534), 임시 시프트 값 (536), 보간된 시프트 값 (538), 정정된 시프트 값 (540), 비-인과적 시프트 값 (162), 참조 신호 표시자 (164), 최종 시프트 값 (116), 이득 파라미터 (160), 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 또는 이들의 조합을, 메모리 (153) 에 저장할 수도 있다. 예를 들어, 분석 데이터 (190) 는 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 비교 값들 (534), 임시 시프트 값 (536), 보간된 시프트 값 (538), 정정된 시프트 값 (540), 비-인과적 시프트 값 (162), 참조 신호 표시자 (164), 최종 시프트 값 (116), 이득 파라미터 (160), 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 또는 이들의 조합을 포함할 수도 있다.
도 6 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 600 으로 지정된다. 시스템 (600) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (600) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
리샘플러 (504) 는 도 1 의 제 1 오디오 신호 (130) 를 리샘플링 (예컨대, 다운샘플링 또는 업샘플링) 함으로써, 제 1 리샘플링된 신호 (530) 의 제 1 샘플들 (620) 을 발생시킬 수도 있다. 리샘플러 (504) 는 도 1 의 제 2 오디오 신호 (132) 를 리샘플링 (예컨대, 다운샘플링 또는 업샘플링) 함으로써, 제 2 리샘플링된 신호 (532) 의 제 2 샘플들 (650) 을 발생시킬 수도 있다.
제 1 오디오 신호 (130) 는 도 3 의 샘플들 (320) 을 발생시키기 위해 제 1 샘플 레이트 (Fs) 에서 샘플링될 수도 있다. 제 1 샘플 레이트 (Fs) 는 광대역 (WB) 대역폭과 연관된 제 1 레이트 (예컨대, 16 킬로헤르츠 (kHz)), 초 광대역 (SWB) 대역폭과 연관된 제 2 레이트 (예컨대, 32 kHz), 전체 대역 (FB) 대역폭과 연관된 제 3 레이트 (예컨대, 48 kHz), 또는 다른 레이트에 대응할 수도 있다. 제 2 오디오 신호 (132) 는 도 3 의 제 2 샘플들 (350) 을 발생시키기 위해, 제 1 샘플 레이트 (Fs) 에서 샘플링될 수도 있다.
일부 구현예들에서, 리샘플러 (504) 는 제 1 오디오 신호 (130) (또는, 제 2 오디오 신호 (132)) 를 리샘플링하기 전에, 제 1 오디오 신호 (130) (또는, 제 2 오디오 신호 (132)) 를 사전-프로세싱할 수도 있다. 리샘플러 (504) 는 무한 임펄스 응답 (IIR) 필터 (예컨대, 1차 IIR 필터) 에 기초하여 제 1 오디오 신호 (130) (또는, 제 2 오디오 신호 (132)) 를 필터링함으로써, 제 1 오디오 신호 (130) (또는, 제 2 오디오 신호 (132)) 를 사전-프로세싱할 수도 있다. IIR 필터는 다음 수식에 기초할 수도 있다:
Figure pct00011
수식 4
여기서, α 는 0.68 또는 0.72 와 같은, 포지티브이다. 리샘플링 전에 디-엠퍼시스를 수행하는 것은, 앨리어싱 (aliasing), 신호 조정, 또는 양자와 같은, 효과들을 감소시킬 수도 있다. 제 1 오디오 신호 (130) (예컨대, 사전 프로세싱된 제 1 오디오 신호 (130)) 및 제 2 오디오 신호 (132) (예컨대, 사전- 프로세싱된 제 2 오디오 신호 (132)) 는 리샘플링 인자 (D) 에 기초하여 리샘플링될 수도 있다. 리샘플링 인자 (D) 는 제 1 샘플 레이트 (Fs) 에 기초할 수도 있다 (예컨대, D = Fs/8, D=2Fs, 등).
대안적인 구현예들에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 는 리샘플링 전에, 안티-앨리어싱 필터를 이용하여 저역 통과 필터링되거나 또는 데시메이트될 수도 있다. 데시메이션 필터는 리샘플링 인자 (D) 에 기초할 수도 있다. 특정의 예에서, 리샘플러 (504) 는 제 1 샘플 레이트 (Fs) 가 특정의 레이트 (예컨대, 32 kHz) 에 대응한다고 결정하는 것에 응답하여, 제 1 차단 주파수 (예컨대, π/D 또는 π/4) 를 가진 데시메이션 필터를 선택할 수도 있다. 다수의 신호들 (예컨대, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 을 디-엠퍼사이징함으로써 앨리어싱을 감소시키는 것은, 데시메이션 필터를 다수의 신호들에 적용하는 것 보다 계산적으로 덜 비쌀 수도 있다.
제 1 샘플들 (620) 은 샘플 (622), 샘플 (624), 샘플 (626), 샘플 (628), 샘플 (630), 샘플 (632), 샘플 (634), 샘플 (636), 하나 이상의 추가적인 샘플들, 또는 이들의 조합을 포함할 수도 있다. 제 1 샘플들 (620) 은 도 3 의 제 1 샘플들 (320) 의 서브세트 (예컨대, 1/8) 를 포함할 수도 있다. 샘플 (622), 샘플 (624), 하나 이상의 추가적인 샘플들, 또는 이들의 조합은 프레임 (302) 에 대응할 수도 있다. 샘플 (626), 샘플 (628), 샘플 (630), 샘플 (632), 하나 이상의 추가적인 샘플들, 또는 이들의 조합은 프레임 (304) 에 대응할 수도 있다. 샘플 (634), 샘플 (636), 하나 이상의 추가적인 샘플들, 또는 이들의 조합은 프레임 (306) 에 대응할 수도 있다.
제 2 샘플들 (650) 은 샘플 (652), 샘플 (654), 샘플 (656), 샘플 (658), 샘플 (660), 샘플 (662), 샘플 (664), 샘플 (666), 하나 이상의 추가적인 샘플들, 또는 이들의 조합을 포함할 수도 있다. 제 2 샘플들 (650) 은 도 3 의 제 2 샘플들 (350) 의 서브세트 (예컨대, 1/8) 를 포함할 수도 있다. 샘플들 (654-660) 은 샘플들 (354-360) 에 대응할 수도 있다. 예를 들어, 샘플들 (654-660) 은 샘플들 (354-360) 의 서브세트 (예컨대, 1/8) 를 포함할 수도 있다. 샘플들 (656-662) 은 샘플들 (356-362) 에 대응할 수도 있다. 예를 들어, 샘플들 (656-662) 은 샘플들 (356-362) 의 서브세트 (예컨대, 1/8) 를 포함할 수도 있다. 샘플들 (658-664) 은 샘플들 (358-364) 에 대응할 수도 있다. 예를 들어, 샘플들 (658-664) 은 샘플들 (358-364) 의 서브세트 (예컨대, 1/8) 를 포함할 수도 있다. 일부 구현예들에서, 리샘플링 인자는 제 1 값 (예컨대, 1) 에 대응할 수도 있으며, 여기서, 도 6 의 샘플들 (622-636) 및 샘플들 (652-666) 은 도 3 의 샘플들 (322-336) 및 샘플들 (352-366) 과 각각 유사할 수도 있다.
리샘플러 (504) 는 제 1 샘플들 (620), 제 2 샘플들 (650), 또는 양자를, 메모리 (153) 에 저장할 수도 있다. 예를 들어, 분석 데이터 (190) 는 제 1 샘플들 (620), 제 2 샘플들 (650), 또는 양자를 포함할 수도 있다.
도 7 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 700 으로 지정된다. 시스템 (700) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (700) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
메모리 (153) 는 복수의 시프트 값들 (760) 을 저장할 수도 있다. 시프트 값들 (760) 은 제 1 시프트 값 (764) (예컨대, -X ms 또는 -Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다), 제 2 시프트 값 (766) (예컨대, +X ms 또는 +Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다), 또는 양자를 포함할 수도 있다. 시프트 값들 (760) 은 하위 시프트 값 (예컨대, 최소 시프트 값, T_MIN) 내지 상위 시프트 값 (예컨대, 최대 시프트 값, T_MAX) 의 범위일 수도 있다. 시프트 값들 (760) 은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 예상된 시간 시프트 (예컨대, 최대 예상된 시간 시프트) 를 표시할 수도 있다.
동작 동안, 신호 비교기 (506) 는 제 1 샘플들 (620) 및 제 2 샘플들 (650) 에 적용된 시프트 값들 (760) 에 기초하여, 비교 값들 (534) 을 결정할 수도 있다. 예를 들어, 샘플들 (626-632) 은 제 1 시간 (t) 에 대응할 수도 있다. 예시하기 위하여, 도 1 의 입력 인터페이스(들) (112) 는 프레임 (304) 에 대응하는 샘플들 (626-632) 을 대략 제 1 시간 (t) 에서 수신할 수도 있다. 제 1 시프트 값 (764) (예컨대, -X ms 또는 -Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 은 제 2 시간 (t-1) 에 대응할 수도 있다.
샘플들 (654-660) 은 제 2 시간 (t-1) 에 대응할 수도 있다. 예를 들어, 입력 인터페이스(들) (112) 는 샘플들 (654-660) 을 대략 제 2 시간 (t-1) 에서 수신할 수도 있다. 신호 비교기 (506) 는 샘플들 (626-632) 및 샘플들 (654-660) 에 기초하여 제 1 시프트 값 (764) 에 대응하는 제 1 비교 값 (714) (예컨대, 차이 값 또는 교차-상관 값) 을 결정할 수도 있다. 예를 들어, 제 1 비교 값 (714) 은 샘플들 (626-632) 과 샘플들 (654-660) 의 교차-상관의 절대값에 대응할 수도 있다. 다른 예로서, 제 1 비교 값 (714) 은 샘플들 (626-632) 과 샘플들 (654-660) 사이의 차이를 표시할 수도 있다.
제 2 시프트 값 (766) (예컨대, +X ms 또는 +Y 샘플들, 여기서, X 및 Y 는 포지티브 실수들을 포함한다) 은 제 3 시간 (t+1) 에 대응할 수도 있다. 샘플들 (658-664) 은 제 3 시간 (t+1) 에 대응할 수도 있다. 예를 들어, 입력 인터페이스(들) (112) 는 샘플들 (658-664) 을 대략 제 3 시간 (t+1) 에서 수신할 수도 있다. 신호 비교기 (506) 는 샘플들 (626-632) 및 샘플들 (658-664) 에 기초하여, 제 2 시프트 값 (766) 에 대응하는 제 2 비교 값 (716) (예컨대, 차이 값 또는 교차-상관 값) 을 결정할 수도 있다. 예를 들어, 제 2 비교 값 (716) 은 샘플들 (626-632) 과 샘플들 (658-664) 의 교차-상관의 절대값에 대응할 수도 있다. 다른 예로서, 제 2 비교 값 (716) 은 샘플들 (626-632) 과 샘플들 (658-664) 사이의 차이를 표시할 수도 있다. 신호 비교기 (506) 는 비교 값들 (534) 을 메모리 (153) 에 저장할 수도 있다. 예를 들어, 분석 데이터 (190) 는 비교 값들 (534) 을 포함할 수도 있다.
신호 비교기 (506) 는 비교 값들 (534) 의 다른 값들 보다 더 높은 (또는, 더 낮은) 값을 가지는 비교 값들 (534) 의 선택된 비교 값 (736) 을 식별할 수도 있다. 예를 들어, 신호 비교기 (506) 는 제 2 비교 값 (716) 이 제 1 비교 값 (714) 보다 크거나 같다고 결정하는 것에 응답하여, 제 2 비교 값 (716) 을 선택된 비교 값 (736) 으로서 선택할 수도 있다. 일부 구현예들에서, 비교 값들 (534) 은 교차-상관 값들에 대응할 수도 있다. 신호 비교기 (506) 는 제 2 비교 값 (716) 이 제 1 비교 값 (714) 보다 크다고 결정하는 것에 응답하여, 샘플들 (626-632) 이 샘플들 (654-660) 보다 샘플들 (658-664) 과 더 높은 상관을 갖는다고 결정할 수도 있다. 신호 비교기 (506) 는 더 높은 상관을 표시하는 제 2 비교 값 (716) 을 선택된 비교 값 (736) 으로서 선택할 수도 있다. 다른 구현예들에서, 비교 값들 (534) 은 차이 값들에 대응할 수도 있다. 신호 비교기 (506) 는 제 2 비교 값 (716) 이 제 1 비교 값 (714) 보다 작다고 결정하는 것에 응답하여, 샘플들 (626-632) 이 샘플들 (654-660) 보다 샘플들 (658-664) 과 더 큰 유사도 (예컨대, 더 낮은 차이) 를 갖는다고 결정할 수도 있다. 신호 비교기 (506) 는 더 낮은 차이를 표시하는 제 2 비교 값 (716) 을 선택된 비교 값 (736) 으로서 선택할 수도 있다.
선택된 비교 값 (736) 은 비교 값들 (534) 의 다른 값들보다 더 높은 상관 (또는, 더 낮은 차이) 을 표시할 수도 있다. 신호 비교기 (506) 는 선택된 비교 값 (736) 에 대응하는 시프트 값들 (760) 의 임시 시프트 값 (536) 을 식별할 수도 있다. 예를 들어, 신호 비교기 (506) 는 제 2 시프트 값 (766) 이 선택된 비교 값 (736) (예컨대, 제 2 비교 값 (716)) 에 대응한다고 결정하는 것에 응답하여, 제 2 시프트 값 (766) 을 임시 시프트 값 (536) 으로서 식별할 수도 있다.
신호 비교기 (506) 는 다음 수식에 기초하여, 선택된 비교 값 (736) 을 결정할 수도 있다:
Figure pct00012
수식 5
여기서, maxXCorr 는 선택된 비교 값 (736) 에 대응하며, k 는 시프트 값에 대응한다. w(n)*l' 는 디-엠퍼사이징되고, 리샘플링되고, 그리고 윈도우된 제 1 오디오 신호 (130) 에 대응하며, w(n)*r' 는 디-엠퍼사이징되고, 리샘플링되고, 그리고 윈도우된 제 2 오디오 신호 (132) 에 대응한다. 예를 들어, w(n)*l' 는 샘플들 (626-632) 에 대응할 수도 있으며, w(n-1)*r' 는 샘플들 (654-660) 에 대응할 수도 있으며, w(n)*r' 는 샘플들 (656-662) 에 대응할 수도 있으며, w(n+1)*r' 는 샘플들 (658-664) 에 대응할 수도 있다. -K 는 시프트 값들 (760) 의 하위 시프트 값 (예컨대, 최소 시프트 값) 에 대응할 수도 있으며, K 는 시프트 값들 (760) 의 상위 시프트 값 (예컨대, 최대 시프트 값) 에 대응할 수도 있다. 수식 5 에서, w(n)*l' 는 제 1 오디오 신호 (130) 가 우측 (r) 채널 신호 또는 좌측 (l) 채널 신호에 대응하는지 여부와는 독립적으로, 제 1 오디오 신호 (130) 에 대응한다. 수식 5 에서, w(n)*r' 는 제 2 오디오 신호 (132) 가 우측 (r) 채널 신호 또는 좌측 (l) 채널 신호에 대응하는지 여부와는 독립적으로, 제 2 오디오 신호 (132) 에 대응한다.
신호 비교기 (506) 는 다음 수식에 기초하여 임시 시프트 값 (536) 을 결정할 수도 있다:
Figure pct00013
수식 6
여기서, T 는 임시 시프트 값 (536) 에 대응한다.
신호 비교기 (506) 는 도 6 의 리샘플링 인자 (D) 에 기초하여 임시 시프트 값 (536) 을 리샘플링된 샘플들로부터 원래 샘플들에 맵핑할 수도 있다. 예를 들어, 신호 비교기 (506) 는 리샘플링 인자 (D) 에 기초하여 임시 시프트 값 (536) 을 업데이트할 수도 있다. 예시하기 위하여, 신호 비교기 (506) 는 임시 시프트 값 (536) 을 임시 시프트 값 (536) (예컨대, 3) 과 리샘플링 인자 (D) (예컨대, 4) 의 곱 (예컨대, 12) 으로 설정할 수도 있다.
도 8 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 800 으로 지정된다. 시스템 (800) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (800) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 메모리 (153) 는 시프트 값들 (860) 을 저장하도록 구성될 수도 있다. 시프트 값들 (860) 은 제 1 시프트 값 (864), 제 2 시프트 값 (866), 또는 양자를 포함할 수도 있다.
동작 동안, 보간기 (510) 는 본원에서 설명하는 바와 같이, 임시 시프트 값 (536) (예컨대, 12) 에 가장 가까운 시프트 값들 (860) 을 발생시킬 수도 있다. 맵핑된 시프트 값들은 리샘플링 인자 (D) 에 기초하여, 리샘플링된 샘플들로부터 원래 샘플들에 맵핑된 시프트 값들 (760) 에 대응할 수도 있다. 예를 들어, 맵핑된 시프트 값들의 제 1 맵핑된 시프트 값은 제 1 시프트 값 (764) 과 리샘플링 인자 (D) 의 곱에 대응할 수도 있다. 맵핑된 시프트 값들의 제 1 맵핑된 시프트 값과, 맵핑된 시프트 값들의 각각의 제 2 맵핑된 시프트 값 사이의 차이는 임계값 (예컨대, 4 와 같은, 리샘플링 인자 (D)) 보다 크거나 또는 동일할 수도 있다. 시프트 값들 (860) 은 시프트 값들 (760) 보다 더 미세한 그래뉼래러티를 가질 수도 있다. 예를 들어, 시프트 값들 (860) 중 낮은 값 (예컨대, 최소 값) 과 임시 시프트 값 (536) 사이의 차이는 임계값 (예컨대, 4) 미만일 수도 있다. 임계값은 도 6 의 리샘플링 인자 (D) 에 대응할 수도 있다. 시프트 값들 (860) 은 제 1 값 (예컨대, 임시 시프트 값 (536) - (임계값-1)) 내지 제 2 값 (예컨대, 임시 시프트 값 (536) + (임계값-1)) 의 범위일 수도 있다.
보간기 (510) 는 본원에서 설명하는 바와 같이, 비교 값들 (534) 에 대해 보간을 수행함으로써, 시프트 값들 (860) 에 대응하는 보간된 비교 값들 (816) 을 발생시킬 수도 있다. 시프트 값들 (860) 중 하나 이상에 대응하는 비교 값들은 비교 값들 (534) 의 더 낮은 그래뉼래러티 때문에, 비교 값들 (534) 로부터 배제될 수도 있다. 보간된 비교 값들 (816) 을 이용하는 것은, 임시 시프트 값 (536) 에 가장 가까운 특정의 시프트 값에 대응하는 보간된 비교 값이 도 7 의 제 2 비교 값 (716) 보다 더 높은 상관 (또는, 더 낮은 차이) 을 표시하는지 여부를 결정하기 위해, 시프트 값들 (860) 중 하나 이상에 대응하는 보간된 비교 값들의 탐색을 가능하게 할 수도 있다.
도 8 은 보간된 비교 값들 (816) 및 비교 값들 (534) (예컨대, 교차-상관 값들) 의 예들을 예시하는 그래프 (820) 를 포함한다. 보간기 (510) 는 해닝 (hanning) 윈도우된 sinc 보간, IIR 필터 기반 보간, 스플라인 보간, 다른 유형의 신호 보간, 또는 이들의 조합에 기초하여 보간을 수행할 수도 있다. 예를 들어, 보간기 (510) 는 다음 수식에 기초하여, 해닝 윈도우된 sinc 보간을 수행할 수도 있다:
Figure pct00014
수식 7
여기서,
Figure pct00015
이고, b 는 윈도우 sinc 함수에 대응하며,
Figure pct00016
는 임시 시프트 값 (536) 에 대응한다.
Figure pct00017
는 비교 값들 (534) 의 특정의 비교 값에 대응할 수도 있다. 예를 들어,
Figure pct00018
는 i 가 4 에 대응할 때 제 1 시프트 값 (예컨대, 8) 에 대응하는 비교 값들 (534) 의 제 1 비교 값을 표시할 수도 있다.
Figure pct00019
는 i 가 0 에 대응할 때 임시 시프트 값 (536) (예컨대, 12) 에 대응하는 제 2 비교 값 (716) 을 표시할 수도 있다.
Figure pct00020
는 i 가 -4 에 대응할 때 제 3 시프트 값 (예컨대, 16) 에 대응하는 비교 값들 (534) 의 제 3 비교 값을 표시할 수도 있다.
R(k)32kHz 는 보간된 비교 값들 (816) 의 특정의 보간된 값에 대응할 수도 있다. 보간된 비교 값들 (816) 의 각각의 보간된 값은 윈도우 sinc 함수 (b) 와, 제 1 비교 값, 제 2 비교 값 (716), 및 제 3 비교 값의 각각의 곱의 합에 대응할 수도 있다. 예를 들어, 보간기 (510) 는 윈도우 sinc 함수 (b) 와 제 1 비교 값의 제 1 곱, 윈도우 sinc 함수 (b) 와 제 2 비교 값 (716) 의 제 2 곱, 및 윈도우 sinc 함수 (b) 와 제 3 비교 값의 제 3 곱을 결정할 수도 있다. 보간기 (510) 는 제 1 곱, 제 2 곱, 및 제 3 곱의 합에 기초하여 특정의 보간된 값을 결정할 수도 있다. 보간된 비교 값들 (816) 의 제 1 보간된 값은 제 1 시프트 값 (예컨대, 9) 에 대응할 수도 있다. 윈도우 sinc 함수 (b) 는 제 1 시프트 값에 대응하는 제 1 값을 가질 수도 있다. 보간된 비교 값들 (816) 의 제 2 보간된 값은 제 2 시프트 값 (예컨대, 10) 에 대응할 수도 있다. 윈도우 sinc 함수 (b) 는 제 2 시프트 값에 대응하는 제 2 값을 가질 수도 있다. 윈도우 sinc 함수 (b) 의 제 1 값은 제 2 값과는 상이할 수도 있다. 따라서, 제 1 보간된 값은 제 2 보간된 값과 상이할 수도 있다.
수식 7 에서, 8 kHz 는 비교 값들 (534) 의 제 1 레이트에 대응할 수도 있다. 예를 들어, 제 1 레이트는 비교 값들 (534) 에 포함된 프레임 (예컨대, 도 3 의 프레임 (304)) 에 대응하는 비교 값들의 수 (예컨대, 8) 를 표시할 수도 있다. 32 kHz 는 보간된 비교 값들 (816) 의 제 2 레이트에 대응할 수도 있다. 예를 들어, 제 2 레이트는 보간된 비교 값들 (816) 에 포함된 프레임 (예컨대, 도 3 의 프레임 (304)) 에 대응하는 보간된 비교 값들의 수 (예컨대, 32) 를 표시할 수도 있다.
보간기 (510) 는 보간된 비교 값들 (816) 의 보간된 비교 값 (838) (예컨대, 최대 값 또는 최소 값) 을 선택할 수도 있다. 보간기 (510) 는 보간된 비교 값 (838) 에 대응하는 시프트 값들 (860) 의 시프트 값 (예컨대, 14) 을 선택할 수도 있다. 보간기 (510) 는 선택된 시프트 값 (예컨대, 제 2 시프트 값 (866)) 을 표시하는 보간된 시프트 값 (538) 을 발생시킬 수도 있다.
조악한 접근법을 이용하여 임시 시프트 값 (536) 을 결정하고 임시 시프트 값 (536) 주위에서 탐색하여 보간된 시프트 값 (538) 을 결정하는 것은, 탐색 효율 또는 정확도를 손상시킴이 없이 탐색 복잡성을 감소시킬 수도 있다.
도 9a 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 900 으로 지정된다. 시스템 (900) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (900) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 시스템 (900) 은 메모리 (153), 시프트 정제기 (911), 또는 양자를 포함할 수도 있다. 메모리 (153) 는 프레임 (302) 에 대응하는 제 1 시프트 값 (962) 을 저장하도록 구성될 수도 있다. 예를 들어, 분석 데이터 (190) 는 제 1 시프트 값 (962) 을 포함할 수도 있다. 제 1 시프트 값 (962) 은 임시 시프트 값, 보간된 시프트 값, 정정된 시프트 값, 최종 시프트 값, 또는 프레임 (302) 과 연관된 비-인과적 시프트 값에 대응할 수도 있다. 프레임 (302) 은 제 1 오디오 신호 (130) 에서의 프레임 (304) 보다 선행할 수도 있다. 시프트 정제기 (911) 는 도 1 의 시프트 정제기 (511) 에 대응할 수도 있다.
도 9a 는 또한 920 으로 일반적으로 지정된 동작의 예시적인 방법의 플로우 차트를 포함한다. 방법 (920) 은 도 1 의, 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 도 2 의, 시간 등화기(들) (208), 인코더 (214), 제 1 디바이스 (204), 도 5 의 시프트 정제기 (511), 시프트 정제기 (911), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (920) 은 901 에서, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이의 절대값이 제 1 임계치보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (911) 는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이의 절대값이 제 1 임계치 (예컨대, 시프트 변화 임계치) 보다 큰지 여부를 결정할 수도 있다.
방법 (920) 은 또한 901 에서, 절대값이 제 1 임계치 이하라고 결정하는 것에 응답하여, 902 에서, 정정된 시프트 값 (540) 을 보간된 시프트 값 (538) 을 표시하도록 설정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (911) 는 절대값이 시프트 변화 임계치보다 작거나 또는 같다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 을 보간된 시프트 값 (538) 을 표시하도록 설정할 수도 있다. 일부 구현예들에서, 시프트 변화 임계치는 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 과 같을 때 정정된 시프트 값 (540) 이 보간된 시프트 값 (538) 으로 설정되어야 한다는 것을 표시하는 제 1 값 (예컨대, 0) 을 가질 수도 있다. 대안적인 구현예들에서, 시프트 변화 임계치는 902 에서, 정정된 시프트 값 (540) 이 보간된 시프트 값 (538) 으로, 더 큰 자유도로, 설정되어야 한다는 것을 표시하는 제 2 값 (예컨대, ≥1) 을 가질 수도 있다. 예를 들어, 정정된 시프트 값 (540) 은 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이들의 범위에 대해, 보간된 시프트 값 (538) 으로 설정될 수도 있다. 예시하기 위하여, 정정된 시프트 값 (540) 은 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이 (예컨대, -2, -1, 0, 1, 2) 의 절대값이 시프트 변화 임계치 (예컨대, 2) 보다 작거나 또는 같을 때, 보간된 시프트 값 (538) 으로 설정될 수도 있다.
방법 (920) 은 901 에서, 절대값이 제 1 임계치보다 크다고 결정하는 것에 응답하여, 904 에서, 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 큰지 여부를 결정하는 단계를 더 포함한다. 예를 들어, 시프트 정제기 (911) 는 절대값이 시프트 변화 임계치보다 크다고 결정하는 것에 응답하여, 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 큰지 여부를 결정할 수도 있다.
방법 (920) 은 또한 904 에서, 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 크다고 결정하는 것에 응답하여, 906 에서, 하위 시프트 값 (930) 을 제 1 시프트 값 (962) 과 제 2 임계치 사이의 차이로 설정하고, 상위 시프트 값 (932) 을 제 1 시프트 값 (962) 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (911) 는 제 1 시프트 값 (962) (예컨대, 20) 이 보간된 시프트 값 (538) (예컨대, 14) 보다 크다고 결정하는 것에 응답하여, 하위 시프트 값 (930) (예컨대, 17) 을 제 1 시프트 값 (962) (예컨대, 20) 과 제 2 임계치 (예컨대, 3) 사이의 차이로 설정할 수도 있다. 추가적으로, 또는 대안적으로, 시프트 정제기 (911) 는 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 크다고 결정하는 것에 응답하여, 상위 시프트 값 (932) (예컨대, 20) 을 제 1 시프트 값 (962) 으로 설정할 수도 있다. 제 2 임계치는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이에 기초할 수도 있다. 일부 구현예들에서, 하위 시프트 값 (930) 은 보간된 시프트 값 (538) 과 임계치 (예컨대, 제 2 임계치) 사이의 차이로 설정될 수도 있으며, 상위 시프트 값 (932) 은 제 1 시프트 값 (962) 과 임계치 (예컨대, 제 2 임계치) 사이의 차이로 설정될 수도 있다.
방법 (920) 은 904 에서, 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 910 에서, 하위 시프트 값 (930) 을 제 1 시프트 값 (962) 으로 설정하고, 상위 시프트 값 (932) 을 제 1 시프트 값 (962) 과 제 3 임계치의 합으로 설정하는 단계를 더 포함한다. 예를 들어, 시프트 정제기 (911) 는 제 1 시프트 값 (962) (예컨대, 10) 이 보간된 시프트 값 (538) (예컨대, 14) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 하위 시프트 값 (930) 을 제 1 시프트 값 (962) (예컨대, 10) 으로 설정할 수도 있다. 추가적으로, 또는 대안적으로, 시프트 정제기 (911) 는 제 1 시프트 값 (962) 이 보간된 시프트 값 (538) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 상위 시프트 값 (932) (예컨대, 13) 을 제 1 시프트 값 (962) (예컨대, 10) 과 제 3 임계치 (예컨대, 3) 의 합으로 설정할 수도 있다. 제 3 임계치는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이에 기초할 수도 있다. 일부 구현예들에서, 하위 시프트 값 (930) 은 제 1 시프트 값 (962) 과 임계치 (예컨대, 제 3 임계치) 사이의 차이로 설정될 수도 있으며, 상위 시프트 값 (932) 은 보간된 시프트 값 (538) 과 임계치 (예컨대, 제 3 임계치) 사이의 차이로 설정될 수도 있다.
방법 (920) 은 또한 908 에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (960) 에 기초하여, 비교 값들 (916) 을 결정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (911) (또는, 신호 비교기 (506)) 는 도 7 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (960) 에 기초하여, 비교 값들 (916) 을 발생시킬 수도 있다. 예시하기 위하여, 시프트 값들 (960) 은 하위 시프트 값 (930) (예컨대, 17) 내지 상위 시프트 값 (932) (예컨대, 20) 의 범위일 수도 있다. 시프트 정제기 (911) (또는, 신호 비교기 (506)) 는 샘플들 (326-332), 및 제 2 샘플들 (350) 의 특정의 서브세트에 기초하여, 비교 값들 (916) 의 특정의 비교 값을 발생시킬 수도 있다. 제 2 샘플들 (350) 의 특정의 서브세트는 시프트 값들 (960) 의 특정의 시프트 값 (예컨대, 17) 에 대응할 수도 있다. 특정의 비교 값은 샘플들 (326-332) 과, 제 2 샘플들 (350) 의 특정의 서브세트 사이의 차이 (또는, 상관) 를 표시할 수도 있다.
방법 (920) 은 912 에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여 발생된 비교 값들 (916) 에 기초하여, 정정된 시프트 값 (540) 을 결정하는 단계를 더 포함한다. 예를 들어, 시프트 정제기 (911) 는 비교 값들 (916) 에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다. 예시하기 위하여, 제 1 경우에, 비교 값들 (916) 이 교차-상관 값들에 대응할 때, 시프트 정제기 (911) 는 보간된 시프트 값 (538) 에 대응하는 도 8 의 보간된 비교 값 (838) 이 비교 값들 (916) 의 최고 비교 값보다 크거나 또는 같다고 결정할 수도 있다. 대안적으로, 비교 값들 (916) 이 차이 값들에 대응할 때, 시프트 정제기 (911) 는 보간된 비교 값 (838) 이 비교 값들 (916) 의 최저 비교 값보다 작거나 또는 같다고 결정할 수도 있다. 이 경우, 시프트 정제기 (911) 는 제 1 시프트 값 (962) (예컨대, 20) 이 보간된 시프트 값 (538) (예컨대, 14) 보다 크다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 을 하위 시프트 값 (930) (예컨대, 17) 으로 설정할 수도 있다. 대안적으로, 시프트 정제기 (911) 는 제 1 시프트 값 (962) (예컨대, 10) 이 보간된 시프트 값 (538) (예컨대, 14) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 을 상위 시프트 값 (932) (예컨대, 13) 으로 설정할 수도 있다.
제 2 경우에, 비교 값들 (916) 이 교차-상관 값들에 대응할 때, 시프트 정제기 (911) 는 보간된 비교 값 (838) 이 비교 값들 (916) 의 최고 비교 값 보다 작다고 결정할 수도 있으며, 정정된 시프트 값 (540) 을 최고 비교 값에 대응하는 시프트 값들 (960) 의 특정의 시프트 값 (예컨대, 18) 으로 설정할 수도 있다. 대안적으로, 비교 값들 (916) 이 차이 값들에 대응할 때, 시프트 정제기 (911) 는 보간된 비교 값 (838) 이 비교 값들 (916) 의 최저 비교 값 보다 크다고 결정할 수도 있으며, 정정된 시프트 값 (540) 을 최저 비교 값에 대응하는 시프트 값들 (960) 의 특정의 시프트 값 (예컨대, 18) 으로 설정할 수도 있다.
비교 값들 (916) 은 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 및 시프트 값들 (960) 에 기초하여, 발생될 수도 있다. 정정된 시프트 값 (540) 은 도 7 을 참조하여 설명된 바와 같이, 신호 비교기 (506) 에 의해 수행되는 것과 유사한 프로시저를 이용하여, 비교 값들 (916) 에 기초하여 발생될 수도 있다.
따라서, 방법 (920) 은 시프트 정제기 (911) 로 하여금, 연속된 (또는, 인접한) 프레임들과 연관된 시프트 값에서의 변화를 제한가능하게 할 수도 있다. 시프트 값에서의 감소된 변화는 인코딩 동안 샘플 손실 또는 샘플 중복을 감소시킬 수도 있다.
도 9b 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 950 으로 지정된다. 시스템 (950) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (950) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 시스템 (950) 은 메모리 (153), 시프트 정제기 (511), 또는 양자를 포함할 수도 있다. 시프트 정제기 (511) 는 보간된 시프트 조정기 (958) 를 포함할 수도 있다. 보간된 시프트 조정기 (958) 는 본원에서 설명하는 바와 같이, 제 1 시프트 값 (962) 에 기초하여, 보간된 시프트 값 (538) 을 선택적으로 조정하도록 구성될 수도 있다. 시프트 정제기 (511) 는 도 9a, 도 9c 를 참조하여 설명되는 바와 같이, 보간된 시프트 값 (538) (예컨대, 조정된 보간된 시프트 값 (538)) 에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다.
도 9b 는 또한 951 로 일반적으로 지정된 동작의 예시적인 방법의 플로우 차트를 포함한다. 방법 (951) 은 도 1 의, 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 도 2 의, 시간 등화기(들) (208), 인코더 (214), 제 1 디바이스 (204), 도 5 의 시프트 정제기 (511), 도 9a 의 시프트 정제기 (911), 보간된 시프트 조정기 (958), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (951) 은 952 에서, 제 1 시프트 값 (962) 과 비구속된 보간된 시프트 값 (956) 사이의 차이에 기초하여, 오프셋 (957) 을 발생시키는 단계를 포함한다. 예를 들어, 보간된 시프트 조정기 (958) 는 제 1 시프트 값 (962) 과 비구속된 보간된 시프트 값 (956) 사이의 차이에 기초하여, 오프셋 (957) 을 발생시킬 수도 있다. 비구속된 보간된 시프트 값 (956) 은 (예컨대, 보간된 시프트 조정기 (958) 에 의한 조정 이전에) 보간된 시프트 값 (538) 에 대응할 수도 있다. 보간된 시프트 조정기 (958) 는 비구속된 보간된 시프트 값 (956) 을 메모리 (153) 에 저장할 수도 있다. 예를 들어, 분석 데이터 (190) 는 비구속된 보간된 시프트 값 (956) 을 포함할 수도 있다.
방법 (951) 은 또한 953 에서, 오프셋 (957) 의 절대값이 임계치 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 보간된 시프트 조정기 (958) 는 오프셋 (957) 의 절대값이 임계치를 만족시키는지 여부를 결정할 수도 있다. 임계치는 보간된 시프트 제한 MAX_SHIFT_CHANGE (예컨대, 4) 에 대응할 수도 있다.
방법 (951) 은 953 에서, 오프셋 (957) 의 절대값이 임계치 보다 크다고 결정하는 것에 응답하여, 954 에서, 제 1 시프트 값 (962), 오프셋 (957) 의 부호, 및 임계치에 기초하여, 보간된 시프트 값 (538) 을 설정하는 단계를 포함한다. 예를 들어, 보간된 시프트 조정기 (958) 는 오프셋 (957) 의 절대값이 임계치를 만족시키지 못한다 (예컨대, 임계치 보다 크다) 고 결정하는 것에 응답하여, 보간된 시프트 값 (538) 을 구속할 수도 있다. 예시하기 위하여, 보간된 시프트 조정기 (958) 는 제 1 시프트 값 (962), 오프셋 (957) 의 부호 (예컨대, +1 또는 -1), 및 임계치 (예컨대, 보간된 시프트 값 (538) = 제 1 시프트 값 (962) + 부호 (오프셋 (957)) * 임계치) 에 기초하여, 보간된 시프트 값 (538) 을 조정할 수도 있다.
방법 (951) 은 953 에서, 오프셋 (957) 의 절대값이 임계치 보다 작거나 또는 같다고 결정하는 것에 응답하여, 955 에서, 보간된 시프트 값 (538) 을 비구속된 보간된 시프트 값 (956) 으로 설정하는 단계를 포함한다. 예를 들어, 보간된 시프트 조정기 (958) 는 오프셋 (957) 의 절대값이 임계치를 만족시킨다 (예컨대, 임계치 보다 작거나 또는 같다) 고 결정하는 것에 응답하여, 보간된 시프트 값 (538) 을 변경하는 것을 억제할 수도 있다.
따라서, 방법 (951) 은 제 1 시프트 값 (962) 에 대한 보간된 시프트 값 (538) 에서의 변화가 보간 시프트 제한을 만족시키도록, 보간된 시프트 값 (538) 을 구속하는 것을 가능하게 할 수도 있다.
도 9c 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 970 으로 지정된다. 시스템 (970) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (970) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 시스템 (970) 은 메모리 (153), 시프트 정제기 (921), 또는 양자를 포함할 수도 있다. 시프트 정제기 (921) 는 도 5 의 시프트 정제기 (511) 에 대응할 수도 있다.
도 9c 는 또한 971 로 일반적으로 지정된 동작의 예시적인 방법의 플로우 차트를 포함한다. 방법 (971) 은 도 1 의, 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 도 2 의, 시간 등화기(들) (208), 인코더 (214), 제 1 디바이스 (204), 도 5 의 시프트 정제기 (511), 도 9a 의 시프트 정제기 (911), 시프트 정제기 (921), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (971) 은 972 에서, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 비-제로인지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) 는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 비-제로인지 여부를 결정할 수도 있다.
방법 (971) 은 972 에서, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 제로라고 결정하는 것에 응답하여, 973 에서, 정정된 시프트 값 (540) 을 보간된 시프트 값 (538) 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) 는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 제로라고 결정하는 것에 응답하여, 보간된 시프트 값 (538) 에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다 (예컨대, 정정된 시프트 값 (540) = 보간된 시프트 값 (538)).
방법 (971) 은 972 에서, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 비-제로라고 결정하는 것에 응답하여, 975 에서, 오프셋 (957) 의 절대값이 임계치 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) 는 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 비-제로라고 결정하는 것에 응답하여, 오프셋 (957) 의 절대값이 임계치 보다 큰지 여부를 결정할 수도 있다. 오프셋 (957) 은 도 9b 를 참조하여 설명된 바와 같이, 제 1 시프트 값 (962) 과 비구속된 보간된 시프트 값 (956) 사이의 차이에 대응할 수도 있다. 임계치는 보간된 시프트 제한 MAX_SHIFT_CHANGE (예컨대, 4) 에 대응할 수도 있다.
방법 (971) 은 972 에서, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 사이의 차이가 비-제로라고 결정하는 것, 또는 975 에서, 오프셋 (957) 의 절대값이 임계치 보다 작거나 또는 같다고 결정하는 것에 응답하여, 976 에서, 하위 시프트 값 (930) 을 제 1 임계치와, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 중 최소치 사이의 차이로 설정하고, 그리고 상위 시프트 값 (932) 을 제 2 임계치와, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 중 최대치의 합으로 설정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) 는 오프셋 (957) 의 절대값이 임계치 보다 작거나 또는 같다고 결정하는 것에 응답하여, 제 1 임계치와, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 중 최소치 사이의 차이에 기초하여, 하위 시프트 값 (930) 을 결정할 수도 있다. 시프트 정제기 (921) 는 또한 제 2 임계치와, 제 1 시프트 값 (962) 과 보간된 시프트 값 (538) 중 최대치의 합에 기초하여, 상위 시프트 값 (932) 을 결정할 수도 있다.
방법 (971) 은 또한 977 에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (960) 에 기초하여, 비교 값들 (916) 을 발생시키는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) (또는, 신호 비교기 (506)) 는 도 7 을 참조하여 설명되는 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (960) 에 기초하여, 비교 값들 (916) 을 발생시킬 수도 있다. 시프트 값들 (960) 은 하위 시프트 값 (930) 내지 상위 시프트 값 (932) 의 범위일 수도 있다. 방법 (971) 은 979 로 속행할 수도 있다.
방법 (971) 은 975 에서, 오프셋 (957) 의 절대값이 임계치 보다 크다고 결정하는 것에 응답하여, 978 에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 비구속된 보간된 시프트 값 (956) 에 기초하여, 비교 값 (915) 을 발생시키는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) (또는, 신호 비교기 (506)) 는 도 7 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 비구속된 보간된 시프트 값 (956) 에 기초하여, 비교 값 (915) 을 발생시킬 수도 있다.
방법 (971) 은 또한 979 에서, 비교 값들 (916), 비교 값 (915), 또는 이들의 조합에 기초하여, 정정된 시프트 값 (540) 을 결정하는 단계를 포함한다. 예를 들어, 시프트 정제기 (921) 는 도 9a 를 참조하여 설명된 바와 같이, 비교 값들 (916), 비교 값 (915), 또는 이들의 조합에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다. 일부 구현예들에서, 시프트 정제기 (921) 는 시프트 변동으로 인한 로컬 극대값들을 회피하기 위해 비교 값 (915) 과 비교 값들 (916) 의 비교에 기초하여, 정정된 시프트 값 (540) 을 결정할 수도 있다.
일부의 경우, 제 1 오디오 신호 (130), 제 1 리샘플링된 신호 (530), 제 2 오디오 신호 (132), 제 2 리샘플링된 신호 (532), 또는 이들의 조합의 고유의 피치는 시프트 추정 프로세스를 간섭할 수도 있다. 이러한 경우, 피치로 인한 간섭을 감소시키고 다수의 채널들 사이의 시프트 추정의 신뢰성을 향상시키기 위해 피치 디-엠퍼시스 또는 피치 필터링이 수행될 수도 있다. 일부의 경우, 시프트 추정 프로세스를 간섭할 수도 있는, 배경 잡음이 제 1 오디오 신호 (130), 제 1 리샘플링된 신호 (530), 제 2 오디오 신호 (132), 제 2 리샘플링된 신호 (532), 또는 이들의 조합에 존재할 수도 있다. 이러한 경우, 다수의 채널들 사이의 시프트 추정의 신뢰성을 향상시키기 위해, 잡음 억제 또는 잡음 소거가 이용될 수도 있다.
도 10a 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1000 으로 지정된다. 시스템 (1000) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1000) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
도 10a 는 또한 1020 으로 일반적으로 지정된 동작의 예시적인 방법의 플로우 차트를 포함한다. 방법 (1020) 은 시프트 변화 분석기 (512), 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1020) 은 1001 에서, 제 1 시프트 값 (962) 이 0 과 같은지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 프레임 (302) 에 대응하는 제 1 시프트 값 (962) 이 시간 시프트 없음을 표시하는 제 1 값 (예컨대, 0) 을 갖는지 여부를 결정할 수도 있다. 방법 (1020) 은 1001 에서, 제 1 시프트 값 (962) 이 0 과 같다고 결정하는 것에 응답하여, 1010 으로 속행하는 단계를 포함한다.
방법 (1020) 은 1001 에서, 제 1 시프트 값 (962) 이 비-제로라고 결정하는 것에 응답하여, 1002 에서, 제 1 시프트 값 (962) 이 0 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 프레임 (302) 에 대응하는 제 1 시프트 값 (962) 이 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 에 대해 시간적으로 지연된다는 것을 표시하는 제 1 값 (예컨대, 포지티브 값) 을 갖는지 여부를 결정할 수도 있다.
방법 (1020) 은 1002 에서, 제 1 시프트 값 (962) 이 0 보다 크다고 결정하는 것에 응답하여, 1004 에서, 정정된 시프트 값 (540) 이 0 보다 작은지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 제 1 값 (예컨대, 포지티브 값) 을 갖는다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 이 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 시간적으로 지연된다는 것을 표시하는 제 2 값 (예컨대, 네거티브 값) 을 갖는지 여부를 결정할 수도 있다. 방법 (1020) 은 1004 에서, 정정된 시프트 값 (540) 이 0 보다 작다고 결정하는 것에 응답하여, 1008 로 속행하는 단계를 포함한다. 방법 (1020) 은 1004 에서, 정정된 시프트 값 (540) 이 0 보다 크거나 또는 같다고 결정하는 것에 응답하여, 1010 으로 속행하는 단계를 포함한다.
방법 (1020) 은 1002 에서, 제 1 시프트 값 (962) 이 0 보다 작다고 결정하는 것에 응답하여, 1006 에서, 정정된 시프트 값 (540) 이 0 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) 이 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 에 대해 시간적으로 지연된다는 것을 표시하는 제 1 값 (예컨대, 포지티브 값) 을 갖는지 여부를 결정할 수도 있다. 방법 (1020) 은 1006 에서, 정정된 시프트 값 (540) 이 0 보다 크다고 결정하는 것에 응답하여, 1008 로 속행하는 단계를 포함한다. 방법 (1020) 은 1006 에서, 정정된 시프트 값 (540) 이 0 보다 작거나 또는 같다고 결정하는 것에 응답하여, 1010 으로 속행하는 단계를 포함한다.
방법 (1020) 은 1008 에서, 최종 시프트 값 (116) 을 0 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 최종 시프트 값 (116) 을 시간 시프트 없음을 표시하는 특정의 값 (예컨대, 0) 으로 설정할 수도 있다. 최종 시프트 값 (116) 은 선행 신호 및 지체된 신호가 프레임 (302) 을 발생시킨 후 기간 동안 스위칭되었다고 결정하는 것에 응답하여 특정의 값 (예컨대, 0) 으로 설정될 수도 있다. 예를 들어, 프레임 (302) 은 제 1 오디오 신호 (130) 가 선행 신호이고 제 2 오디오 신호 (132) 가 지체된 신호임을 표시하는 제 1 시프트 값 (962) 에 기초하여 인코딩될 수도 있다. 정정된 시프트 값 (540) 은 제 1 오디오 신호 (130) 가 지체된 신호이고 제 2 오디오 신호 (132) 가 선행 신호임을 표시할 수도 있다. 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 에 의해 표시되는 선행 신호가 정정된 시프트 값 (540) 에 의해 표시되는 선행 신호와 구별된다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 을 특정의 값으로 설정할 수도 있다.
방법 (1020) 은 1010 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 과 같은지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 및 정정된 시프트 값 (540) 이 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 동일한 시간 지연을 표시하는지 여부를 결정할 수도 있다.
방법 (1020) 은 1010 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 과 같다고 결정하는 것에 응답하여, 1012 에서, 최종 시프트 값 (116) 을 정정된 시프트 값 (540) 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 최종 시프트 값 (116) 을 정정된 시프트 값 (540) 으로 설정할 수도 있다.
방법 (1020) 은 1010 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 과 같지 않다고 결정하는 것에 응답하여, 1014 에서, 추정된 시프트 값 (1072) 을 발생시키는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 도 11 을 참조하여 더 설명되는 바와 같이, 정정된 시프트 값 (540) 을 정제함으로써, 추정된 시프트 값 (1072) 을 결정할 수도 있다.
방법 (1020) 은 1016 에서, 최종 시프트 값 (116) 을 추정된 시프트 값 (1072) 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 최종 시프트 값 (116) 을 추정된 시프트 값 (1072) 으로 설정할 수도 있다.
일부 구현예들에서, 시프트 변화 분석기 (512) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 스위칭되지 않았다고 결정하는 것에 응답하여, 비-인과적 시프트 값 (162) 을 제 2 추정된 시프트 값을 표시하도록 설정할 수도 있다. 예를 들어, 시프트 변화 분석기 (512) 는 1001 에서, 제 1 시프트 값 (962) 이 0 과 같다, 1004 에서, 정정된 시프트 값 (540) 이 0 보다 크거나 또는 같다고, 또는 1006 에서, 정정된 시프트 값 (540) 이 0 보다 작거나 또는 같다고 결정하는 것에 응답하여, 비-인과적 시프트 값 (162) 을 정정된 시프트 값 (540) 을 표시하도록 설정할 수도 있다.
따라서, 시프트 변화 분석기 (512) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 지연이 도 3 의 프레임 (302) 과 프레임 (304) 사이에서 스위칭된다고 결정하는 것에 응답하여, 비-인과적 시프트 값 (162) 을 시간 시프트 없음을 표시하도록 설정할 수도 있다. 비-인과적 시프트 값 (162) 이 연속된 프레임들 사이에서 방향들 (예컨대, 포지티브로부터 네거티브 또는 네거티브로부터 포지티브) 을 스위칭하는 것을 방지하는 것은, 인코더 (114) 에서의 다운믹스 신호 발생에서의 왜곡을 감소시키거나, 디코더에서의 업믹스 합성을 위해 추가적인 지연의 사용을 회피하거나, 또는 양자를 행할 수도 있다.
도 10b 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1030 으로 지정된다. 시스템 (1030) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1030) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
도 10b 는 또한 1031 로 일반적으로 지정된 동작의 예시적인 방법의 플로우 차트를 포함한다. 방법 (1031) 은 시프트 변화 분석기 (512), 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1031) 은 1032 에서, 제 1 시프트 값 (962) 이 0 보다 크고 정정된 시프트 값 (540) 이 0 보다 작은지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 0 보다 큰지 여부 및 정정된 시프트 값 (540) 이 0 보다 작은지 여부를 결정할 수도 있다.
방법 (1031) 은 1032 에서, 제 1 시프트 값 (962) 이 0 보다 크고 정정된 시프트 값 (540) 이 0 보다 작다고 결정하는 것에 응답하여, 1033 에서, 최종 시프트 값 (116) 을 0 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 0 보다 크고 정정된 시프트 값 (540) 이 0 보다 작다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 을 시간 시프트 없음을 표시하는 제 1 값 (예컨대, 0) 으로 설정할 수도 있다.
방법 (1031) 은 1032 에서, 제 1 시프트 값 (962) 이 0 보다 작거나 또는 같다 또는 정정된 시프트 값 (540) 이 0 보다 크거나 또는 같다고 결정하는 것에 응답하여, 1034 에서, 제 1 시프트 값 (962) 이 0 보다 작은지 여부 및 정정된 시프트 값 (540) 이 0 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 0 보다 작거나 또는 같다 또는 정정된 시프트 값 (540) 이 0 보다 크거나 또는 같다고 결정하는 것에 응답하여, 제 1 시프트 값 (962) 이 0 보다 작은지 여부 및 정정된 시프트 값 (540) 이 0 보다 큰지 여부를 결정할 수도 있다.
방법 (1031) 은 제 1 시프트 값 (962) 이 0 보다 작다 그리고 정정된 시프트 값 (540) 이 0 보다 크다고 결정하는 것에 응답하여, 1033 으로 속행하는 단계를 포함한다. 방법 (1031) 은 제 1 시프트 값 (962) 이 0 보다 크거나 또는 같다고, 또는 정정된 시프트 값 (540) 이 0 보다 작거나 또는 같다고 결정하는 것에 응답하여, 1035 에서, 최종 시프트 값 (116) 을 정정된 시프트 값 (540) 으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 0 보다 크거나 또는 같다 또는 정정된 시프트 값 (540) 이 0 보다 작거나 또는 같다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 을 정정된 시프트 값 (540) 으로 설정할 수도 있다.
도 11 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1100 으로 지정된다. 시스템 (1100) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1100) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 도 11 은 또한 1120 으로 일반적으로 지정되는 동작의 방법을 예시하는 플로우 차트를 포함한다. 방법 (1120) 은 시프트 변화 분석기 (512), 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다. 방법 (1120) 은 도 10a 의 단계 1014 에 대응할 수도 있다.
방법 (1120) 은 1104 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 보다 큰지 여부를 결정할 수도 있다.
방법 (1120) 은 또한 1104 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 보다 크다고 결정하는 것에 응답하여, 1106 에서, 제 1 시프트 값 (1130) 을 정정된 시프트 값 (540) 과 제 1 오프셋 사이의 차이로 설정하고, 제 2 시프트 값 (1132) 을 제 1 시프트 값 (962) 과 제 1 오프셋의 합으로 설정하는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) (예컨대, 20) 이 정정된 시프트 값 (540) (예컨대, 18) 보다 크다고 결정하는 것에 응답하여, 정정된 시프트 값 (540) (예컨대, 정정된 시프트 값 (540) - 제 1 오프셋) 에 기초하여, 제 1 시프트 값 (1130) (예컨대, 17) 을 결정할 수도 있다. 대안적으로, 또는 추가적으로, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) (예컨대, 제 1 시프트 값 (962) + 제 1 오프셋) 에 기초하여, 제 2 시프트 값 (1132) (예컨대, 21) 을 결정할 수도 있다. 방법 (1120) 은 1108 로 속행할 수도 있다.
방법 (1120) 은 1104 에서, 제 1 시프트 값 (962) 이 정정된 시프트 값 (540) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 제 1 시프트 값 (1130) 을 제 1 시프트 값 (962) 과 제 2 오프셋 사이의 차이로 설정하고, 제 2 시프트 값 (1132) 을 정정된 시프트 값 (540) 과 제 2 오프셋의 합으로 설정하는 단계를 더 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 제 1 시프트 값 (962) (예컨대, 10) 이 정정된 시프트 값 (540) (예컨대, 12) 보다 작거나 또는 같다고 결정하는 것에 응답하여, 제 1 시프트 값 (962) (예컨대, 제 1 시프트 값 (962) - 제 2 오프셋) 에 기초하여, 제 1 시프트 값 (1130) (예컨대, 9) 을 결정할 수도 있다. 대안적으로, 또는 추가적으로, 시프트 변화 분석기 (512) 는 정정된 시프트 값 (540) (예컨대, 정정된 시프트 값 (540) + 제 2 오프셋) 에 기초하여 제 2 시프트 값 (1132) (예컨대, 13) 을 결정할 수도 있다. 제 1 오프셋 (예컨대, 2) 은 제 2 오프셋 (예컨대, 3) 과는 상이할 수도 있다. 일부 구현예들에서, 제 1 오프셋은 제 2 오프셋과 동일할 수도 있다. 제 1 오프셋, 제 2 오프셋, 또는 양자 중 더 높은 값은 탐색 범위를 향상시킬 수도 있다.
방법 (1120) 은 또한 1108 에서, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (1160) 에 기초하여, 비교 값들 (1140) 을 발생시키는 단계를 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 도 7 을 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 적용된 시프트 값들 (1160) 에 기초하여, 비교 값들 (1140) 을 발생시킬 수도 있다. 예시하기 위하여, 시프트 값들 (1160) 은 제 1 시프트 값 (1130) (예컨대, 17) 내지 제 2 시프트 값 (1132) (예컨대, 21) 의 범위일 수도 있다. 시프트 변화 분석기 (512) 는 샘플들 (326-332), 및 제 2 샘플들 (350) 의 특정의 서브세트에 기초하여, 비교 값들 (1140) 의 특정의 비교 값을 발생시킬 수도 있다. 제 2 샘플들 (350) 의 특정의 서브세트는 시프트 값들 (1160) 의 특정의 시프트 값 (예컨대, 17) 에 대응할 수도 있다. 특정의 비교 값은 샘플들 (326-332) 과, 제 2 샘플들 (350) 의 특정의 서브세트 사이의 차이 (또는, 상관) 를 표시할 수도 있다.
방법 (1120) 은 1112 에서, 비교 값들 (1140) 에 기초하여, 추정된 시프트 값 (1072) 을 결정하는 단계를 더 포함한다. 예를 들어, 시프트 변화 분석기 (512) 는 비교 값들 (1140) 이 교차-상관 값들에 대응할 때, 비교 값들 (1140) 의 최고 비교 값을 추정된 시프트 값 (1072) 으로서 선택할 수도 있다. 대안적으로, 시프트 변화 분석기 (512) 는 비교 값들 (1140) 이 차이 값들에 대응할 때, 비교 값들 (1140) 의 최저 비교 값을 추정된 시프트 값 (1072) 으로서 선택할 수도 있다.
따라서, 방법 (1120) 은 시프트 변화 분석기 (512) 로 하여금, 정정된 시프트 값 (540) 을 정제함으로써 추정된 시프트 값 (1072) 을 발생시키도록 할 수도 있다. 예를 들어, 시프트 변화 분석기 (512) 는 원래 샘플들에 기초하여 비교 값들 (1140) 을 결정할 수도 있으며, 최고 상관 (또는, 최저 차이) 을 표시하는 비교 값들 (1140) 의 비교 값에 대응하는 추정된 시프트 값 (1072) 을 선택할 수도 있다.
도 12 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1200 으로 지정된다. 시스템 (1200) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1200) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 도 12 는 또한 1220 으로 일반적으로 지정되는 동작의 방법을 예시하는 플로우 차트를 포함한다. 방법 (1220) 은 참조 신호 지정기 (508), 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1220) 은 1202 에서 최종 시프트 값 (116) 이 0 과 같은지 여부를 결정하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 시간 시프트 없음을 표시하는 특정의 값 (예컨대, 0) 을 갖는지 여부를 결정할 수도 있다.
방법 (1220) 은 1202 에서, 최종 시프트 값 (116) 이 0 과 같다고 결정하는 것에 응답하여, 1204 에서, 참조 신호 표시자 (164) 를 변경되지 않은 채로 유지하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 시간 시프트 없음을 표시하는 특정의 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 참조 신호 표시자 (164) 를 변경되지 않은 채로 유지할 수도 있다. 예시하기 위하여, 참조 신호 표시자 (164) 는 프레임 (302) 에서와 동일한 동일한 오디오 신호 (예컨대, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132)) 가 프레임 (304) 과 연관된 참조 신호라는 것을 표시할 수도 있다.
방법 (1220) 은 1202 에서, 최종 시프트 값 (116) 이 비-제로라고 결정하는 것에 응답하여, 1206 에서, 최종 시프트 값 (116) 이 0 보다 큰지 여부를 결정하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 시간 시프트를 표시하는 특정의 값 (예컨대, 비-제로 값) 을 갖는다고 결정하는 것에 응답하여, 최종 시프트 값 (116) 이 제 2 오디오 신호 (132) 가 제 1 오디오 신호 (130) 에 대해 지연된다는 것을 표시하는 제 1 값 (예컨대, 포지티브 값) 또는 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 지연된다는 것을 표시하는 제 2 값 (예컨대, 네거티브 값) 을 갖는지 여부를 결정할 수도 있다.
방법 (1220) 은 최종 시프트 값 (116) 이 제 1 값 (예컨대, 포지티브 값) 을 갖는다고 결정하는 것에 응답하여, 1208 에서, 참조 신호 표시자 (164) 를 제 1 오디오 신호 (130) 가 참조 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 을 갖도록 설정하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 제 1 값 (예컨대, 포지티브 값) 을 갖는다고 결정하는 것에 응답하여, 참조 신호 표시자 (164) 를 제 1 오디오 신호 (130) 가 참조 신호라는 것을 표시하는 제 1 값 (예컨대, 0) 으로 설정할 수도 있다. 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 제 1 값 (예컨대, 포지티브 값) 을 갖는다고 결정하는 것에 응답하여, 제 2 오디오 신호 (132) 가 목표 신호에 대응한다고 결정할 수도 있다.
방법 (1220) 은 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 1210 에서, 참조 신호 표시자 (164) 를 제 2 오디오 신호 (132) 가 참조 신호라는 것을 표시하는 제 2 값 (예컨대, 1) 을 갖도록 설정하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 제 1 오디오 신호 (130) 가 제 2 오디오 신호 (132) 에 대해 지연된다는 것을 표시하는 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 참조 신호 표시자 (164) 를 제 2 오디오 신호 (132) 가 참조 신호라는 것을 표시하는 제 2 값 (예컨대, 1) 으로 설정할 수도 있다. 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 제 1 오디오 신호 (130) 가 목표 신호에 대응한다고 결정할 수도 있다.
참조 신호 지정기 (508) 는 참조 신호 표시자 (164) 를 이득 파라미터 발생기 (514) 에 제공할 수도 있다. 이득 파라미터 발생기 (514) 는 도 5 를 참조하여 설명된 바와 같이, 참조 신호에 기초하여 목표 신호의 이득 파라미터 (예컨대, 이득 파라미터 (160)) 를 결정할 수도 있다.
목표 신호는 참조 신호에 대해 시간적으로 지연될 수도 있다. 참조 신호 표시자 (164) 는 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 가 참조 신호에 대응하는지 여부를 표시할 수도 있다. 참조 신호 표시자 (164) 는 이득 파라미터 (160) 가 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 에 대응하는지 여부를 표시할 수도 있다.
도 13 을 참조하면, 특정의 동작의 방법을 예시하는 플로우 차트가 도시되며 일반적으로 1300 으로 지정된다. 방법 (1300) 은 참조 신호 지정기 (508), 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1300) 은 1302 에서, 최종 시프트 값 (116) 이 0 보다 크거나 또는 같은지 여부를 결정하는 단계를 포함한다. 예를 들어, 참조 신호 지정기 (508) 는 최종 시프트 값 (116) 이 0 보다 크거나 또는 같은지 여부를 결정할 수도 있다. 방법 (1300) 은 또한 1302 에서, 최종 시프트 값 (116) 이 0 보다 크거나 또는 같은지 여부를 결정하는 것에 응답하여, 1208 로 속행하는 단계를 포함한다. 방법 (1300) 은 1302 에서, 최종 시프트 값 (116) 이 0 보다 작다고 결정하는 것에 응답하여, 1210 으로 속행하는 단계를 더 포함한다. 방법 (1300) 은, 최종 시프트 값 (116) 이 시간 시프트 없음을 표시하는 특정의 값 (예컨대, 0) 을 갖는다고 결정하는 것에 응답하여, 참조 신호 표시자 (164) 가 제 1 오디오 신호 (130) 가 참조 신호에 대응한다는 것을 표시하는 제 1 값 (예컨대, 0) 으로 설정된다는 점에서, 도 12 의 방법 (1220) 과는 상이하다. 일부 구현예들에서, 참조 신호 지정기 (508) 가 방법 (1220) 을 수행할 수도 있다. 다른 구현예들에서, 참조 신호 지정기 (508) 가 방법 (1300) 을 수행할 수도 있다.
따라서, 방법 (1300) 은 제 1 오디오 신호 (130) 가 프레임 (302) 에 대한 참조 신호에 대응하는지 여부와는 독립적으로, 최종 시프트 값 (116) 이 시간 시프트 없음을 표시할 때 참조 신호 표시자 (164) 를, 제 1 오디오 신호 (130) 가 참조 신호에 대응한다는 것을 표시하는 특정의 값 (예컨대, 0) 으로 설정가능하게 할 수도 있다.
도 14 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1400 으로 지정된다. 시스템 (1400) 은 도 1 의 시스템 (100), 도 2 의 시스템 (200), 또는 양쪽에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 도 2 의, 시스템 (200), 제 1 디바이스 (204), 또는 이들의 조합은 시스템 (1400) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 제 1 디바이스 (204) 는 제 1 마이크로폰 (146), 제 2 마이크로폰 (148), 제 3 마이크로폰 (1446), 및 제 4 마이크로폰 (1448) 에 커플링된다.
동작 동안, 제 1 디바이스 (204) 는 제 1 마이크로폰 (146) 을 통해서 제 1 오디오 신호 (130) 를, 제 2 마이크로폰 (148) 을 통해서 제 2 오디오 신호 (132) 를, 제 3 마이크로폰 (1446) 을 통해서 제 3 오디오 신호 (1430) 를, 제 4 마이크로폰 (1448) 을 통해서 제 4 오디오 신호 (1432) 를, 수신할 수도 있거나 또는 이들의 조합일 수도 있다. 사운드 소스 (152) 는 나머지 마이크로폰들보다 제 1 마이크로폰 (146), 제 2 마이크로폰 (148), 제 3 마이크로폰 (1446), 또는 제 4 마이크로폰 (1448) 중 하나에 더 가까울 수도 있다. 예를 들어, 사운드 소스 (152) 는 제 2 마이크로폰 (148), 제 3 마이크로폰 (1446), 및 제 4 마이크로폰 (1448) 의 각각보다 제 1 마이크로폰 (146) 에 더 가까울 수도 있다.
시간 등화기(들) (208) 는 도 1 을 참조하여 설명되는 바와 같이, 나머지 오디오 신호들의 각각에 대한, 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 또는 제 4 오디오 신호 (1432) 의 특정의 오디오 신호의 시프트를 표시하는 최종 시프트 값을 결정할 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 에 대한 제 2 오디오 신호 (132) 의 시프트를 표시하는 최종 시프트 값 (116), 제 1 오디오 신호 (130) 에 대한 제 3 오디오 신호 (1430) 의 시프트를 표시하는 제 2 최종 시프트 값 (1416), 제 1 오디오 신호 (130) 에 대한 제 4 오디오 신호 (1432) 의 시프트를 표시하는 제 3 최종 시프트 값 (1418), 또는 이들의 조합을 결정할 수도 있다.
시간 등화기(들) (208) 는 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 및 제 3 최종 시프트 값 (1418) 에 기초하여, 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 또는 제 4 오디오 신호 (1432) 중 하나를 참조 신호로서 선택할 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 및 제 3 최종 시프트 값 (1418) 의 각각이 대응하는 오디오 신호가 특정의 오디오 신호에 대해 시간적으로 지연되거나 또는 대응하는 오디오 신호와 특정의 오디오 신호 사이에 시간 지연이 없다는 것을 표시하는 제 1 값 (예컨대, 비-네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 특정의 신호 (예컨대, 제 1 오디오 신호 (130)) 를 참조 신호로서 선택할 수도 있다. 예시하기 위하여, 시프트 값 (예컨대, 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 또는 제 3 최종 시프트 값 (1418)) 의 포지티브 값은 대응하는 신호 (예컨대, 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 또는 제 4 오디오 신호 (1432)) 가 제 1 오디오 신호 (130) 에 대해 시간적으로 지연된다는 것을 표시할 수도 있다. 시프트 값 (예컨대, 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 또는 제 3 최종 시프트 값 (1418)) 의 제로 값은 대응하는 신호 (예컨대, 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 또는 제 4 오디오 신호 (1432)) 와 제 1 오디오 신호 (130) 사이에 시간 지연이 없다는 것을 표시할 수도 있다.
시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 가 참조 신호에 대응한다는 것을 표시하기 위해 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기(들) (208) 는 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 및 제 4 오디오 신호 (1432) 가 목표 신호들에 대응한다고 결정할 수도 있다.
대안적으로, 시간 등화기(들) (208) 는 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 또는 제 3 최종 시프트 값 (1418) 중 적어도 하나가 특정의 오디오 신호 (예컨대, 제 1 오디오 신호 (130)) 가 다른 오디오 신호 (예컨대, 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 또는 제 4 오디오 신호 (1432)) 에 대해 지연된다는 것을 표시하는 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정할 수도 있다.
시간 등화기(들) (208) 는 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 및 제 3 최종 시프트 값 (1418) 중에서 시프트 값들의 제 1 서브세트를 선택할 수도 있다. 제 1 서브세트의 각각의 시프트 값은 제 1 오디오 신호 (130) 가 대응하는 오디오 신호에 대해 시간적으로 지연된다는 것을 표시하는 값 (예컨대, 네거티브 값) 을 가질 수도 있다. 예를 들어, 제 2 최종 시프트 값 (1416) (예컨대, -12) 은 제 1 오디오 신호 (130) 가 제 3 오디오 신호 (1430) 에 대해 시간적으로 지연된다는 것을 표시할 수도 있다. 제 3 최종 시프트 값 (1418) (예컨대, -14) 은 제 1 오디오 신호 (130) 가 제 4 오디오 신호 (1432) 에 대해 시간적으로 지연된다는 것을 표시할 수도 있다. 시프트 값들의 제 1 서브세트는 제 2 최종 시프트 값 (1416) 및 제 3 최종 시프트 값 (1418) 을 포함할 수도 있다.
시간 등화기(들) (208) 는 대응하는 오디오 신호에 대한 제 1 오디오 신호 (130) 의 더 높은 지연을 표시하는 제 1 서브세트의 특정의 시프트 값 (예컨대, 하부 시프트 값) 을 선택할 수도 있다. 제 2 최종 시프트 값 (1416) 은 제 3 오디오 신호 (1430) 에 대한 제 1 오디오 신호 (130) 의 제 1 지연을 표시할 수도 있다. 제 3 최종 시프트 값 (1418) 은 제 4 오디오 신호 (1432) 에 대한 제 1 오디오 신호 (130) 의 제 2 지연을 표시할 수도 있다. 시간 등화기(들) (208) 는 제 2 지연이 제 1 지연보다 더 길다고 결정하는 것에 응답하여, 시프트 값들의 제 1 서브세트로부터 제 3 최종 시프트 값 (1418) 을 선택할 수도 있다.
시간 등화기(들) (208) 는 특정의 시프트 값에 대응하는 오디오 신호를 참조 신호로서 선택할 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 3 최종 시프트 값 (1418) 에 대응하는 제 4 오디오 신호 (1432) 를 참조 신호로서 선택할 수도 있다. 시간 등화기(들) (208) 는 제 4 오디오 신호 (1432) 가 참조 신호에 대응한다는 것을 표시하기 위해 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 시간 등화기(들) (208) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 및 제 3 오디오 신호 (1430) 가 목표 신호들에 대응한다고 결정할 수도 있다.
시간 등화기(들) (208) 는 참조 신호에 대응하는 특정의 시프트 값에 기초하여, 최종 시프트 값 (116) 및 제 2 최종 시프트 값 (1416) 을 업데이트할 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 2 오디오 신호 (132) 에 대한 제 4 오디오 신호 (1432) 의 제 1 특정의 지연을 표시하기 위해 제 3 최종 시프트 값 (1418) 에 기초하여 최종 시프트 값 (116) 을 업데이트할 수도 있다 (예컨대, 최종 시프트 값 (116) = 최종 시프트 값 (116) - 제 3 최종 시프트 값 (1418)). 예시하기 위하여, 최종 시프트 값 (116) (예컨대, 2) 은 제 2 오디오 신호 (132) 에 대한 제 1 오디오 신호 (130) 의 지연을 표시할 수도 있다. 제 3 최종 시프트 값 (1418) (예컨대, -14) 은 제 4 오디오 신호 (1432) 에 대한 제 1 오디오 신호 (130) 의 지연을 표시할 수도 있다. 최종 시프트 값 (116) 과 제 3 최종 시프트 값 (1418) 사이의 제 1 차이 (예컨대, 16 = 2 - (-14)) 는 제 2 오디오 신호 (132) 에 대한 제 4 오디오 신호 (1432) 의 지연을 표시할 수도 있다. 시간 등화기(들) (208) 는 제 1 차이에 기초하여 최종 시프트 값 (116) 을 업데이트할 수도 있다. 시간 등화기(들) (208) 는 제 3 오디오 신호 (1430) 에 대한 제 4 오디오 신호 (1432) 의 제 2 특정의 지연을 표시하기 위해 제 3 최종 시프트 값 (1418) 에 기초하여 제 2 최종 시프트 값 (1416) (예컨대, 2) 을 업데이트할 수도 있다 (예컨대, 제 2 최종 시프트 값 (1416) = 제 2 최종 시프트 값 (1416) - 제 3 최종 시프트 값 (1418)). 예시하기 위하여, 제 2 최종 시프트 값 (1416) (예컨대, -12) 은 제 3 오디오 신호 (1430) 에 대한 제 1 오디오 신호 (130) 의 지연을 표시할 수도 있다. 제 3 최종 시프트 값 (1418) (예컨대, -14) 은 제 4 오디오 신호 (1432) 에 대한 제 1 오디오 신호 (130) 의 지연을 표시할 수도 있다. 제 2 최종 시프트 값 (1416) 과 제 3 최종 시프트 값 (1418) 사이의 제 2 차이 (예컨대, 2 = -12 - (-14)) 는 제 3 오디오 신호 (1430) 에 대한 제 4 오디오 신호 (1432) 의 지연을 표시할 수도 있다. 시간 등화기(들) (208) 는 제 2 차이에 기초하여 제 2 최종 시프트 값 (1416) 을 업데이트할 수도 있다.
시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 에 대한 제 4 오디오 신호 (1432) 의 지연을 표시하기 위해 제 3 최종 시프트 값 (1418) 을 반전시킬 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 3 최종 시프트 값 (1418) 을 제 4 오디오 신호 (1432) 에 대한 제 1 오디오 신호 (130) 의 지연을 표시하는 제 1 값 (예컨대, -14) 으로부터 제 1 오디오 신호 (130) 에 대한 제 4 오디오 신호 (1432) 의 지연을 표시하는 제 2 값 (예컨대, +14) 으로 업데이트할 수도 있다 (예컨대, 제 3 최종 시프트 값 (1418) = - 제 3 최종 시프트 값 (1418)).
시간 등화기(들) (208) 는 절대 값 함수를 최종 시프트 값 (116) 에 적용함으로써, 비-인과적 시프트 값 (162) 을 발생시킬 수도 있다. 시간 등화기(들) (208) 는 절대 값 함수를 제 2 최종 시프트 값 (1416) 에 적용함으로써 제 2 비-인과적 시프트 값 (1462) 을 발생시킬 수도 있다. 시간 등화기(들) (208) 는 절대 값 함수를 제 3 최종 시프트 값 (1418) 에 적용함으로써 제 3 비-인과적 시프트 값 (1464) 을 발생시킬 수도 있다.
시간 등화기(들) (208) 는 도 1 을 참조하여 설명된 바와 같이, 참조 신호에 기초하여 각각의 목표 신호의 이득 파라미터를 발생시킬 수도 있다. 제 1 오디오 신호 (130) 가 참조 신호에 대응하는 예에서, 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 에 기초하여 제 2 오디오 신호 (132) 의 이득 파라미터 (160) 를, 제 1 오디오 신호 (130) 에 기초하여 제 3 오디오 신호 (1430) 의 제 2 이득 파라미터 (1460) 를, 제 1 오디오 신호 (130) 에 기초하여 제 4 오디오 신호 (1432) 의 제 3 이득 파라미터 (1461) 를 발생시킬 수도 있거나, 또는 이들의 조합일 수도 있다.
시간 등화기(들) (208) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 및 제 4 오디오 신호 (1432) 에 기초하여, 인코딩된 신호 (예컨대, 중간 채널 신호 프레임) 를 발생시킬 수도 있다. 예를 들어, 인코딩된 신호 (예컨대, 제 1 인코딩된 신호 프레임 (1454)) 는 참조 신호 (예컨대, 제 1 오디오 신호 (130)) 의 샘플들 및 목표 신호들 (예컨대, 제 2 오디오 신호 (132), 제 3 오디오 신호 (1430), 및 제 4 오디오 신호 (1432)) 의 샘플들의 합에 대응할 수도 있다. 목표 신호들의 각각의 샘플들은 도 1 을 참조하여 설명된 바와 같이, 대응하는 시프트 값에 기초하여 참조 신호의 샘플들에 대해 시간-시프트될 수도 있다. 시간 등화기(들) (208) 는 이득 파라미터 (160) 와 제 2 오디오 신호 (132) 의 샘플들의 제 1 곱, 제 2 이득 파라미터 (1460) 와 제 3 오디오 신호 (1430) 의 샘플들의 제 2 곱, 및 제 3 이득 파라미터 (1461) 와 제 4 오디오 신호 (1432) 의 샘플들의 제 3 곱을 결정할 수도 있다. 제 1 인코딩된 신호 프레임 (1454) 은 제 1 오디오 신호 (130) 의 샘플들, 제 1 곱, 제 2 곱, 및 제 3 곱의 합에 대응할 수도 있다. 즉, 제 1 인코딩된 신호 프레임 (1454) 은 다음 수식들에 기초하여 발생될 수도 있다:
Figure pct00021
수식 8a
Figure pct00022
수식 8b
여기서, M 은 중간 채널 프레임 (예컨대, 제 1 인코딩된 신호 프레임 (1454)) 에 대응하고, Ref(n) 는 참조 신호 (예컨대, 제 1 오디오 신호 (130)) 의 샘플들에 대응하고, gD1 은 이득 파라미터 (160) 에 대응하며, gD2 는 제 2 이득 파라미터 (1460) 에 대응하고, gD3 는 제 3 이득 파라미터 (1461) 에 대응하고, N1 은 비-인과적 시프트 값 (162) 에 대응하고, N2 는 제 2 비-인과적 시프트 값 (1462) 에 대응하고, N3 은 제 3 비-인과적 시프트 값 (1464) 에 대응하고, Targ1(n+N1) 은 제 1 목표 신호 (예컨대, 제 2 오디오 신호 (132)) 의 샘플들에 대응하고, Targ2(n+N2) 은 제 2 목표 신호 (예컨대, 제 3 오디오 신호 (1430)) 의 샘플들에 대응하고, Targ3(n+N3) 은 제 3 목표 신호 (예컨대, 제 4 오디오 신호 (1432)) 의 샘플들에 대응한다.
시간 등화기(들) (208) 는 목표 신호들의 각각에 대응하는 인코딩된 신호 (예컨대, 사이드 채널 신호 프레임) 를 발생시킬 수도 있다. 예를 들어, 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여, 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있다. 예를 들어, 제 2 인코딩된 신호 프레임 (566) 은 도 5 를 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 의 샘플들과 제 2 오디오 신호 (132) 의 샘플들 사이의 차이에 대응할 수도 있다. 이와 유사하게, 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 및 제 3 오디오 신호 (1430) 에 기초하여 제 3 인코딩된 신호 프레임 (1466) (예컨대, 사이드 채널 프레임) 을 발생시킬 수도 있다. 예를 들어, 제 3 인코딩된 신호 프레임 (1466) 은 제 1 오디오 신호 (130) 의 샘플들과 제 3 오디오 신호 (1430) 의 샘플들의 차이에 대응할 수도 있다. 시간 등화기(들) (208) 는 제 1 오디오 신호 (130) 및 제 4 오디오 신호 (1432) 에 기초하여 제 4 인코딩된 신호 프레임 (1468) (예컨대, 사이드 채널 프레임) 을 발생시킬 수도 있다. 예를 들어, 제 4 인코딩된 신호 프레임 (1468) 은 제 1 오디오 신호 (130) 의 샘플들과 제 4 오디오 신호 (1432) 의 샘플들의 차이에 대응할 수도 있다. 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1466), 및 제 4 인코딩된 신호 프레임 (1468) 은 다음 수식들 중 하나에 기초하여 발생될 수도 있다:
Figure pct00023
수식 9a
Figure pct00024
수식 9b
여기서, SP 는 사이드 채널 프레임에 대응하고, Ref(n) 은 참조 신호 (예컨대, 제 1 오디오 신호 (130)) 의 샘플들에 대응하고, gDP 는 연관된 목표 신호에 대응하는 이득 파라미터에 대응하고, NP 는 연관된 목표 신호에 대응하는 비-인과적 시프트 값에 대응하고, TargP(n+NP) 는 연관된 목표 신호의 샘플들에 대응한다. 예를 들어, SP 는 제 2 인코딩된 신호 프레임 (566) 에 대응할 수도 있으며, gDP 는 이득 파라미터 (160) 에 대응할 수도 있으며, NP 는 비-인과적 시프트 값 (162) 에 대응할 수도 있으며, TargP(n+NP) 는 제 2 오디오 신호 (132) 의 샘플들에 대응할 수도 있다. 다른 예로서, SP 는 제 3 인코딩된 신호 프레임 (1466) 에 대응할 수도 있으며, gDP 는 제 2 이득 파라미터 (1460) 에 대응할 수도 있으며, NP 는 제 2 비-인과적 시프트 값 (1462) 에 대응할 수도 있으며, TargP(n+NP) 는 제 3 오디오 신호 (1430) 의 샘플들에 대응할 수도 있다. 추가적인 예로서, SP 는 제 4 인코딩된 신호 프레임 (1468) 에 대응할 수도 있으며, gDP 는 제 3 이득 파라미터 (1461) 에 대응할 수도 있으며, NP 는 제 3 비-인과적 시프트 값 (1464) 에 대응할 수도 있으며, TargP(n+NP) 는 제 4 오디오 신호 (1432) 의 샘플들에 대응할 수도 있다.
시간 등화기(들) (208) 는 제 2 최종 시프트 값 (1416), 제 3 최종 시프트 값 (1418), 제 2 비-인과적 시프트 값 (1462), 제 3 비-인과적 시프트 값 (1464), 제 2 이득 파라미터 (1460), 제 3 이득 파라미터 (1461), 제 1 인코딩된 신호 프레임 (1454), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1466), 제 4 인코딩된 신호 프레임 (1468), 또는 이들의 조합을, 메모리 (153) 에 저장할 수도 있다. 예를 들어, 분석 데이터 (190) 는 제 2 최종 시프트 값 (1416), 제 3 최종 시프트 값 (1418), 제 2 비-인과적 시프트 값 (1462), 제 3 비-인과적 시프트 값 (1464), 제 2 이득 파라미터 (1460), 제 3 이득 파라미터 (1461), 제 1 인코딩된 신호 프레임 (1454), 제 3 인코딩된 신호 프레임 (1466), 제 4 인코딩된 신호 프레임 (1468), 또는 이들의 조합을 포함할 수도 있다.
송신기 (110) 는 제 1 인코딩된 신호 프레임 (1454), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1466), 제 4 인코딩된 신호 프레임 (1468), 이득 파라미터 (160), 제 2 이득 파라미터 (1460), 제 3 이득 파라미터 (1461), 참조 신호 표시자 (164), 비-인과적 시프트 값 (162), 제 2 비-인과적 시프트 값 (1462), 제 3 비-인과적 시프트 값 (1464), 또는 이들의 조합을 송신할 수도 있다. 참조 신호 표시자 (164) 는 도 2 의 참조 신호 표시자들 (264) 에 대응할 수도 있다. 제 1 인코딩된 신호 프레임 (1454), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1466), 제 4 인코딩된 신호 프레임 (1468), 또는 이들의 조합은 도 2 의 인코딩된 신호들 (202) 에 대응할 수도 있다. 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 제 3 최종 시프트 값 (1418), 또는 이들의 조합은 도 2 의 최종 시프트 값들 (216) 에 대응할 수도 있다. 비-인과적 시프트 값 (162), 제 2 비-인과적 시프트 값 (1462), 제 3 비-인과적 시프트 값 (1464), 또는 이들의 조합은 도 2 의 비-인과적 시프트 값들 (262) 에 대응할 수도 있다. 이득 파라미터 (160), 제 2 이득 파라미터 (1460), 제 3 이득 파라미터 (1461), 또는 이들의 조합은 도 2 의 이득 파라미터들 (260) 에 대응할 수도 있다.
도 15 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1500 으로 지정된다. 시스템 (1500) 은 본원에서 설명하는 바와 같이, 시간 등화기(들) (208) 가 다수의 참조 신호들을 결정하도록 구성될 수도 있다는 점에서, 도 14 의 시스템 (1400) 과 상이하다.
동작 동안, 시간 등화기(들) (208) 는 제 1 마이크로폰 (146) 을 통해서 제 1 오디오 신호 (130) 를, 제 2 마이크로폰 (148) 을 통해서 제 2 오디오 신호 (132) 를, 제 3 마이크로폰 (1446) 을 통해서 제 3 오디오 신호 (1430) 를, 제 4 마이크로폰 (1448) 을 통해서 제 4 오디오 신호 (1432) 를 수신할 수도 있거나, 또는 이들의 조합일 수도 있다. 시간 등화기(들) (208) 는 도 1 및 도 5 를 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 에 기초하여, 최종 시프트 값 (116), 비-인과적 시프트 값 (162), 이득 파라미터 (160), 참조 신호 표시자 (164), 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 또는 이들의 조합을 결정할 수도 있다. 이와 유사하게, 시간 등화기(들) (208) 는 제 3 오디오 신호 (1430) 및 제 4 오디오 신호 (1432) 에 기초하여, 제 2 최종 시프트 값 (1516), 제 2 비-인과적 시프트 값 (1562), 제 2 이득 파라미터 (1560), 제 2 참조 신호 표시자 (1552), 제 3 인코딩된 신호 프레임 (1564) (예컨대, 중간 채널 신호 프레임), 제 4 인코딩된 신호 프레임 (1566) (예컨대, 사이드 채널 신호 프레임), 또는 이들의 조합을 결정할 수도 있다.
송신기 (110) 는 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1564), 제 4 인코딩된 신호 프레임 (1566), 이득 파라미터 (160), 제 2 이득 파라미터 (1560), 비-인과적 시프트 값 (162), 제 2 비-인과적 시프트 값 (1562), 참조 신호 표시자 (164), 제 2 참조 신호 표시자 (1552), 또는 이들의 조합을 송신할 수도 있다. 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1564), 제 4 인코딩된 신호 프레임 (1566), 또는 이들의 조합은 도 2 의 인코딩된 신호들 (202) 에 대응할 수도 있다. 이득 파라미터 (160), 제 2 이득 파라미터 (1560), 또는 양자는 도 2 의 이득 파라미터들 (260) 에 대응할 수도 있다. 최종 시프트 값 (116), 제 2 최종 시프트 값 (1516), 또는 양자는 도 2 의 최종 시프트 값들 (216) 에 대응할 수도 있다. 비-인과적 시프트 값 (162), 제 2 비-인과적 시프트 값 (1562), 또는 양자는 도 2 의 비-인과적 시프트 값들 (262) 에 대응할 수도 있다. 참조 신호 표시자 (164), 제 2 참조 신호 표시자 (1552), 또는 양자는 도 2 의 참조 신호 표시자들 (264) 에 대응할 수도 있다.
도 16 을 참조하면, 특정의 동작의 방법을 예시하는 플로우 차트가 도시되며, 일반적으로 1600 으로 지정된다. 방법 (1600) 은 도 1 의, 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1600) 은 1602 에서, 제 1 디바이스에서, 제 2 오디오 신호에 대한 제 1 오디오 신호의 시프트를 표시하는 최종 시프트 값을 결정하는 단계를 포함한다. 예를 들어, 도 1 의 제 1 디바이스 (104) 의 시간 등화기 (108) 는 도 1 에 대해 설명한 바와 같이, 제 2 오디오 신호 (132) 에 대한 제 1 오디오 신호 (130) 의 시프트를 표시하는 최종 시프트 값 (116) 을 결정할 수도 있다. 다른 예로서, 시간 등화기 (108) 는 도 14 에 대해 설명한 바와 같이, 제 2 오디오 신호 (132) 에 대한 제 1 오디오 신호 (130) 의 시프트를 표시하는 최종 시프트 값 (116), 제 3 오디오 신호 (1430) 에 대한 제 1 오디오 신호 (130) 의 시프트를 표시하는 제 2 최종 시프트 값 (1416), 제 4 오디오 신호 (1432) 에 대한 제 1 오디오 신호 (130) 의 시프트를 표시하는 제 3 최종 시프트 값 (1418), 또는 이들의 조합을 결정할 수도 있다. 추가적인 예로서, 시간 등화기 (108) 는 도 15 를 참조하여 설명된 바와 같이, 제 2 오디오 신호 (132) 에 대한 제 1 오디오 신호 (130) 의 시프트를 표시하는 최종 시프트 값 (116), 제 4 오디오 신호 (1432) 에 대한 제 3 오디오 신호 (1430) 의 시프트를 표시하는 제 2 최종 시프트 값 (1516), 또는 양자를 결정할 수도 있다.
방법 (1600) 은 또한 1604 에서, 제 1 디바이스에서, 제 1 오디오 신호의 제 1 샘플들 및 제 2 오디오 신호의 제 2 샘플들에 기초하여 적어도 하나의 인코딩된 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 제 1 디바이스 (104) 의 시간 등화기 (108) 는 도 5 를 참조하여 더 설명된 바와 같이, 도 3 의 샘플들 (326-332) 및 도 3 의 샘플들 (358-364) 에 기초하여, 인코딩된 신호들 (102) 을 발생시킬 수도 있다. 샘플들 (358-364) 은 최종 시프트 값 (116) 에 기초하는 양 만큼 샘플들 (326-332) 에 대해 시간-시프트될 수도 있다.
다른 예로서, 시간 등화기 (108) 는 도 14 를 참조하여 설명된 바와 같이, 도 3 의, 샘플들 (326-332), 샘플들 (358-364), 제 3 오디오 신호 (1430) 의 제 3 샘플들, 제 4 오디오 신호 (1432) 의 제 4 샘플들, 또는 이들의 조합에 기초하여 제 1 인코딩된 신호 프레임 (1454) 을 발생시킬 수도 있다. 샘플들 (358-364), 제 3 샘플들, 및 제 4 샘플들은 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 및 제 3 최종 시프트 값 (1418) 에 기초하는 양 만큼, 샘플들 (326-332) 에 대해 각각 시간-시프트될 수도 있다.
시간 등화기 (108) 는 도 5 및 도 14 를 참조하여 설명된 바와 같이, 도 3 의 샘플들 (326-332) 및 샘플들 (358-364) 에 기초하여, 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 샘플들 (326-332) 및 제 3 샘플들에 기초하여, 제 3 인코딩된 신호 프레임 (1466) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 샘플들 (326-332) 및 제 4 샘플들에 기초하여, 제 4 인코딩된 신호 프레임 (1468) 을 발생시킬 수도 있다.
추가적인 예로서, 시간 등화기 (108) 는 도 5 및 도 15 를 참조하여 설명된 바와 같이, 샘플들 (326-332) 및 샘플들 (358-364) 에 기초하여, 제 1 인코딩된 신호 프레임 (564) 및 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 도 15 를 참조하여 설명된 바와 같이, 제 3 오디오 신호 (1430) 의 제 3 샘플들 및 제 4 오디오 신호 (1432) 의 제 4 샘플들에 기초하여, 제 3 인코딩된 신호 프레임 (1564) 및 제 4 인코딩된 신호 프레임 (1566) 을 발생시킬 수도 있다. 제 4 샘플들은 도 15 를 참조하여 설명된 바와 같이, 제 2 최종 시프트 값 (1516) 에 기초하여, 제 3 샘플들에 대해 시간-시프트될 수도 있다.
방법 (1600) 은 1606 에서, 적어도 하나의 인코딩된 신호를 제 1 디바이스로부터 제 2 디바이스로 전송하는 단계를 더 포함한다. 예를 들어, 도 1 의 송신기 (110) 는 도 1 을 참조하여 더 설명된 바와 같이, 적어도 인코딩된 신호들 (102) 을 제 1 디바이스 (104) 로부터 제 2 디바이스 (106) 로 전송할 수도 있다. 다른 예로서, 송신기 (110) 는 도 14 를 참조하여 설명된 바와 같이, 적어도 제 1 인코딩된 신호 프레임 (1454), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1466), 제 4 인코딩된 신호 프레임 (1468), 또는 이들의 조합을 전송할 수도 있다. 추가적인 예로서, 송신기 (110) 는 도 15 를 참조하여 설명된 바와 같이, 적어도 제 1 인코딩된 신호 프레임 (564), 제 2 인코딩된 신호 프레임 (566), 제 3 인코딩된 신호 프레임 (1564), 제 4 인코딩된 신호 프레임 (1566), 또는 이들의 조합을 전송할 수도 있다.
방법 (1600) 은 따라서, 제 1 오디오 신호의 제 1 샘플들, 및 제 2 오디오 신호에 대한 제 1 오디오 신호의 시프트를 표시하는 시프트 값에 기초하여 제 1 오디오 신호에 대해 시간-시프트된 제 2 오디오 신호의 제 2 샘플들에 기초하여, 인코딩된 신호들을 발생시키는 것을 가능하게 할 수도 있다. 제 2 오디오 신호의 샘플들을 시간-시프트시키는 것은 조인트-채널 코딩 효율을 향상시킬 수도 있는, 제 1 오디오 신호와 제 2 오디오 신호 사이의 차이를 감소시킬 수도 있다. 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 하나는 최종 시프트 값 (116) 의 부호 (예컨대, 네거티브 또는 포지티브) 에 기초하여 참조 신호로서 지정될 수도 있다. 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 의 나머지 (예컨대, 목표 신호) 는 비-인과적 시프트 값 (162) (예컨대, 최종 시프트 값 (116) 의 절대값) 에 기초하여 시간-시프트되거나 또는 오프셋될 수도 있다.
도 17 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1700 으로 지정된다. 시스템 (1700) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1700) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
시스템 (1700) 은 시프트 추정기 (1704) 를 통해서, 프레임간 시프트 변동 분석기 (1706), 참조 신호 지정기 (508), 또는 양자에 커플링된 신호 사전-프로세서 (1702) 를 포함한다. 특정의 양태에서, 신호 사전-프로세서 (1702) 는 리샘플러 (504) 에 대응할 수도 있다. 특정의 양태에서, 시프트 추정기 (1704) 는 도 1 의 시간 등화기 (108) 에 대응할 수도 있다. 예를 들어, 시프트 추정기 (1704) 는 시간 등화기 (108) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
프레임간 시프트 변동 분석기 (1706) 는 목표 신호 조정기 (1708) 를 통해서, 이득 파라미터 발생기 (514) 에 커플링될 수도 있다. 참조 신호 지정기 (508) 는 프레임간 시프트 변동 분석기 (1706), 이득 파라미터 발생기 (514), 또는 양자에 커플링될 수도 있다. 목표 신호 조정기 (1708) 는 중간사이드 (midside) 발생기 (1710) 에 커플링될 수도 있다. 특정의 양태에서, 중간사이드 발생기 (1710) 는 도 5 의 신호 발생기 (516) 에 대응할 수도 있다. 이득 파라미터 발생기 (514) 는 중간사이드 발생기 (1710) 에 커플링될 수도 있다. 중간사이드 발생기 (1710) 는 대역폭 확장 (BWE) 공간 밸런서 (1712), 중간 BWE 코더 (1714), 저 대역 (LB) 신호 재생기 (1716), 또는 이들의 조합에 커플링될 수도 있다. LB 신호 재생기 (1716) 는 LB 사이드 코어 코더 (1718), LB 중간 코어 코더 (1720), 또는 양자에 커플링될 수도 있다. LB 중간 코어 코더 (1720) 는 중간 BWE 코더 (1714), LB 사이드 코어 코더 (1718), 또는 양자에 커플링될 수도 있다. 중간 BWE 코더 (1714) 는 BWE 공간 밸런서 (1712) 에 커플링될 수도 있다.
동작 동안, 신호 사전-프로세서 (1702) 는 오디오 신호 (1728) 를 수신할 수도 있다. 예를 들어, 신호 사전-프로세서 (1702) 는 입력 인터페이스(들) (112) 로부터 오디오 신호 (1728) 를 수신할 수도 있다. 오디오 신호 (1728) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자를 포함할 수도 있다. 신호 사전-프로세서 (1702) 는 도 18 을 참조하여 더 설명된 바와 같이, 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 또는 양자를 발생시킬 수도 있다. 신호 사전-프로세서 (1702) 는 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 또는 양자를, 시프트 추정기 (1704) 로 제공할 수도 있다.
시프트 추정기 (1704) 는 도 19 를 참조하여 더 설명된 바와 같이, 제 1 리샘플링된 신호 (530), 제 2 리샘플링된 신호 (532), 또는 양자에 기초하여, 최종 시프트 값 (116) (T), 비-인과적 시프트 값 (162), 또는 양자를 발생시킬 수도 있다. 시프트 추정기 (1704) 는 최종 시프트 값 (116) 을 프레임간 시프트 변동 분석기 (1706), 참조 신호 지정기 (508), 또는 양자로 제공할 수도 있다.
참조 신호 지정기 (508) 는 도 5, 도 12, 및 도 13 을 참조하여 설명되는 바와 같이, 참조 신호 표시자 (164) 를 발생시킬 수도 있다. 참조 신호 표시자 (164) 는 제 1 오디오 신호 (130) 가 참조 신호에 대응한다는 것을 참조 신호 표시자 (164) 가 표시한다고 결정하는 것에 응답하여, 참조 신호 (1740) 가 제 1 오디오 신호 (130) 를 포함하고 목표 신호 (1742) 가 제 2 오디오 신호 (132) 를 포함한다고 결정할 수도 있다. 대안적으로, 참조 신호 표시자 (164) 는 제 2 오디오 신호 (132) 가 참조 신호에 대응한다는 것을 참조 신호 표시자 (164) 가 표시한다고 결정하는 것에 응답하여, 참조 신호 (1740) 가 제 2 오디오 신호 (132) 를 포함하고 목표 신호 (1742) 가 제 1 오디오 신호 (130) 를 포함한다고 결정할 수도 있다. 참조 신호 지정기 (508) 는 참조 신호 표시자 (164) 를 프레임간 시프트 변동 분석기 (1706), 이득 파라미터 발생기 (514), 또는 양자로 제공할 수도 있다.
프레임간 시프트 변동 분석기 (1706) 는 도 21 을 참조하여 더 설명된 바와 같이, 목표 신호 (1742), 참조 신호 (1740), 제 1 시프트 값 (962) (Tprev), 최종 시프트 값 (116) (T), 참조 신호 표시자 (164), 또는 이들의 조합에 기초하여, 목표 신호 표시자 (1764) 를 발생시킬 수도 있다. 프레임간 시프트 변동 분석기 (1706) 는 목표 신호 표시자 (1764) 를 목표 신호 조정기 (1708) 로 제공할 수도 있다.
목표 신호 조정기 (1708) 는 목표 신호 표시자 (1764), 목표 신호 (1742), 또는 양자에 기초하여, 조정된 목표 신호 (1752) (예컨대, 수정된 목표 채널 (194)) 를 발생시킬 수도 있다. 목표 신호 조정기 (1708) 는 제 1 시프트 값 (962) (Tprev) 으로부터 최종 시프트 값 (116) (T) 으로의 시간 시프트 전개에 기초하여 목표 신호 (1742) 를 조정할 수도 있다. 예를 들어, 제 1 시프트 값 (962) 은 프레임 (302) 에 대응하는 최종 시프트 값을 포함할 수도 있다. 목표 신호 조정기 (1708) 는 최종 시프트 값이 프레임 (304) 에 대응하는 최종 시프트 값 (116) (예컨대, T=4) 보다 낮은, 프레임 (302) 에 대응하는 제 1 값 (예컨대, Tprev=2) 을 갖는 제 1 시프트 값 (962) 으로부터 변화된다고 결정하는 것에 응답하여, 프레임 경계들에 대응하는 목표 신호 (1742) 의 샘플들의 서브세트가 조정된 목표 신호 (1752) 를 발생시키기 위해 평활화 및 느린-시프팅을 통해서 드롭되도록, 목표 신호 (1742) 를 보간할 수도 있다. 대안적으로, 목표 신호 조정기 (1708) 는 최종 시프트 값이 최종 시프트 값 (116) (예컨대, T=2) 보다 큰, 제 1 시프트 값 (962) (예컨대, Tprev=4) 으로부터 변화된다고 결정하는 것에 응답하여, 프레임 경계들에 대응하는 목표 신호 (1742) 의 샘플들의 서브세트가 조정된 목표 신호 (1752) 를 발생시키기 위해 평활화 및 느린-시프팅을 통해서 반복되도록, 목표 신호 (1742) 를 보간할 수도 있다. 평활화 및 느린-시프팅은 하이브리드 Sinc- 및 Lagrange- 보간기들에 기초하여 수행될 수도 있다. 목표 신호 조정기 (1708) 는 최종 시프트 값이 제 1 시프트 값 (962) 으로부터 최종 시프트 값 (116) (예컨대, Tprev=T) 으로 변경되지 않다고 결정하는 것에 응답하여, 조정된 목표 신호 (1752) 를 발생시키기 위해 목표 신호 (1742) 를 시간적으로 오프셋할 수도 있다. 목표 신호 조정기 (1708) 는 조정된 목표 신호 (1752) 를 이득 파라미터 발생기 (514), 중간사이드 발생기 (1710), 또는 양자로 제공할 수도 있다.
이득 파라미터 발생기 (514) 는 도 20 을 참조하여 더 설명된 바와 같이, 참조 신호 표시자 (164), 조정된 목표 신호 (1752), 참조 신호 (1740), 또는 이들의 조합에 기초하여, 이득 파라미터 (160) 를 발생시킬 수도 있다. 이득 파라미터 발생기 (514) 는 이득 파라미터 (160) 를 중간사이드 발생기 (1710) 로 제공할 수도 있다.
중간사이드 발생기 (1710) 는 조정된 목표 신호 (1752), 참조 신호 (1740), 이득 파라미터 (160), 또는 이들의 조합에 기초하여, 중간 신호 (1770), 사이드 신호 (1772), 또는 양자를 발생시킬 수도 있다. 예를 들어, 중간사이드 발생기 (1710) 는 수식 2a 또는 수식 2b 에 기초하여 중간 신호 (1770) 를 발생시킬 수도 있으며, 여기서, M 은 중간 신호 (1770) 에 대응하고, gD 는 이득 파라미터 (160) 에 대응하고, Ref(n) 은 참조 신호 (1740) 의 샘플들에 대응하고, Targ(n+N1) 은 조정된 목표 신호 (1752) 의 샘플들에 대응한다. 중간사이드 발생기 (1710) 는 수식 3a 또는 수식 3b 에 기초하여 사이드 신호 (1772) 를 발생시킬 수도 있으며, 여기서, S 는 사이드 신호 (1772) 에 대응하고, gD 는 이득 파라미터 (160) 에 대응하고, Ref(n) 은 참조 신호 (1740) 의 샘플들에 대응하고, Targ(n+N1) 은 조정된 목표 신호 (1752) 의 샘플들에 대응한다.
중간사이드 발생기 (1710) 는 사이드 신호 (1772) 를 BWE 공간 밸런서 (1712), LB 신호 재생기 (1716), 또는 양자로 제공할 수도 있다. 중간사이드 발생기 (1710) 는 중간 신호 (1770) 를 중간 BWE 코더 (1714), LB 신호 재생기 (1716), 또는 양자로 제공할 수도 있다. LB 신호 재생기 (1716) 는 중간 신호 (1770) 에 기초하여 LB 중간 신호 (1760) 를 발생시킬 수도 있다. 예를 들어, LB 신호 재생기 (1716) 는 중간 신호 (1770) 를 필터링함으로써 LB 중간 신호 (1760) 를 발생시킬 수도 있다. LB 신호 재생기 (1716) 는 LB 중간 신호 (1760) 를 LB 중간 코어 코더 (1720) 로 제공할 수도 있다. LB 중간 코어 코더 (1720) 는 LB 중간 신호 (1760) 에 기초하여 파라미터들 (예컨대, 코어 파라미터들 (1771), 파라미터들 (1775), 또는 양자) 을 발생시킬 수도 있다. 코어 파라미터들 (1771), 파라미터들 (1775), 또는 양자는 여기 파라미터, 보이싱 파라미터, 등을 포함할 수도 있다. LB 중간 코어 코더 (1720) 는 코어 파라미터들 (1771) 을 중간 BWE 코더 (1714) 로, 파라미터들 (1775) 을 LB 사이드 코어 코더 (1718) 로 제공할 수도 있거나, 또는 양자일 수도 있다. 코어 파라미터들 (1771) 은 파라미터들 (1775) 과 동일하거나 또는 별개일 수도 있다. 예를 들어, 코어 파라미터들 (1771) 은 파라미터들 (1775) 중 하나 이상을 포함할 수도 있거나, 파라미터들 (1775) 중 하나 이상을 제외할 수도 있거나, 하나 이상의 추가적인 파라미터들을 포함할 수도 있거나, 또는 이들의 조합일 수도 있다. 중간 BWE 코더 (1714) 는 중간 신호 (1770), 코어 파라미터들 (1771), 또는 이들의 조합에 기초하여, 코딩된 중간 BWE 신호 (1773) 를 발생시킬 수도 있다. 중간 BWE 코더 (1714) 는 코딩된 중간 BWE 신호 (1773) 를 BWE 공간 밸런서 (1712) 로 제공할 수도 있다.
LB 신호 재생기 (1716) 는 사이드 신호 (1772) 에 기초하여 LB 사이드 신호 (1762) 를 발생시킬 수도 있다. 예를 들어, LB 신호 재생기 (1716) 는 사이드 신호 (1772) 를 필터링함으로써 LB 사이드 신호 (1762) 를 발생시킬 수도 있다. LB 신호 재생기 (1716) 는 LB 사이드 신호 (1762) 를 LB 사이드 코어 코더 (1718) 로 제공할 수도 있다.
도 18 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1800 으로 지정된다. 시스템 (1800) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1800) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
시스템 (1800) 은 신호 사전-프로세서 (1702) 를 포함한다. 신호 사전-프로세서 (1702) 는 리샘플링 인자 추정기 (1830), 디-엠퍼사이저 (1804), 디-엠퍼사이저 (1834), 또는 이들의 조합에 커플링된 디멀티플렉서 (DeMUX) (1802) 를 포함할 수도 있다. 디-엠퍼사이저 (1804) 는 리샘플러 (1806) 를 통해서, 디-엠퍼사이저 (1808) 에 커플링될 수도 있다. 디-엠퍼사이저 (1808) 는 리샘플러 (1810) 를 통해서, 기울기 (tilt)-밸런서 (1812) 에 커플링될 수도 있다. 디-엠퍼사이저 (1834) 는 리샘플러 (1836) 를 통해서, 디-엠퍼사이저 (1838) 에 커플링될 수도 있다. 디-엠퍼사이저 (1838) 는 리샘플러 (1840) 를 통해서, 기울기-밸런서 (1842) 에 커플링될 수도 있다.
동작 동안, deMUX (1802) 는 오디오 신호 (1728) 를 디멀티플렉싱함으로써 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 를 발생시킬 수도 있다. deMUX (1802) 는 제 1 오디오 신호 (130), 제 2 오디오 신호 (132), 또는 양자와 연관된 제 1 샘플 레이트 (1860) 를 리샘플링 인자 추정기 (1830) 로 제공할 수도 있다. deMUX (1802) 는 제 1 오디오 신호 (130) 를 디-엠퍼사이저 (1804) 로, 제 2 오디오 신호 (132) 를 디-엠퍼사이저 (1834) 로 제공할 수도 있거나, 또는 양자일 수도 있다.
리샘플링 인자 추정기 (1830) 는 제 1 샘플 레이트 (1860), 제 2 샘플 레이트 (1880), 또는 양자에 기초하여, 제 1 인자 (1862) (d1), 제 2 인자 (1882) (d2), 또는 양자를 발생시킬 수도 있다. 리샘플링 인자 추정기 (1830) 는 제 1 샘플 레이트 (1860), 제 2 샘플 레이트 (1880), 또는 양자에 기초하여, 리샘플링 인자 (D) 를 결정할 수도 있다. 예를 들어, 리샘플링 인자 (D) 는 제 1 샘플 레이트 (1860) 및 제 2 샘플 레이트 (1880) 의 비에 대응할 수도 있다 (예컨대, 리샘플링 인자 (D) = 제 2 샘플 레이트 (1880) / 제 1 샘플 레이트 (1860) 또는 리샘플링 인자 (D) = 제 1 샘플 레이트 (1860) / 제 2 샘플 레이트 (1880)). 제 1 인자 (1862) (d1), 제 2 인자 (1882) (d2), 또는 양자는 리샘플링 인자 (D) 의 인자들일 수도 있다. 예를 들어, 리샘플링 인자 (D) 는 제 1 인자 (1862) (d1) 와 제 2 인자 (1882) (d2) 의 곱에 대응할 수도 있다 (예컨대, 리샘플링 인자 (D) = 제 1 인자 (1862) (d1) * 제 2 인자 (1882) (d2)). 일부 구현예들에서, 제 1 인자 (1862) (d1) 는 제 1 값 (예컨대, 1) 을 가질 수도 있거나, 제 2 인자 (1882) (d2) 는 제 2 값 (예컨대, 1) 을 가질 수도 있거나, 또는 양자이며, 이는 본원에서 설명하는 바와 같이 리샘플링 단계들을 우회한다.
디-엠퍼사이저 (1804) 는 도 6 을 참조하여 설명된 바와 같이, IIR 필터 (예컨대, 1차 IIR 필터) 에 기초하여, 제 1 오디오 신호 (130) 를 필터링함으로써 디-엠퍼사이징된 신호 (1864) 를 발생시킬 수도 있다. 디-엠퍼사이저 (1804) 는 디-엠퍼사이징된 신호 (1864) 를 리샘플러 (1806) 로 제공할 수도 있다. 리샘플러 (1806) 는 제 1 인자 (1862) (d1) 에 기초하여 디-엠퍼사이징된 신호 (1864) 를 리샘플링함으로써 리샘플링된 신호 (1866) 를 발생시킬 수도 있다. 리샘플러 (1806) 는 리샘플링된 신호 (1866) 를 디-엠퍼사이저 (1808) 로 제공할 수도 있다. 디-엠퍼사이저 (1808) 는 도 6 을 참조하여 설명된 바와 같이, IIR 필터에 기초하여, 리샘플링된 신호 (1866) 를 필터링함으로써, 디-엠퍼사이징된 신호 (1868) 를 발생시킬 수도 있다. 디-엠퍼사이저 (1808) 는 디-엠퍼사이징된 신호 (1868) 를 리샘플러 (1810) 로 제공할 수도 있다. 리샘플러 (1810) 는 제 2 인자 (1882) (d2) 에 기초하여 디-엠퍼사이징된 신호 (1868) 를 리샘플링함으로써 리샘플링된 신호 (1870) 를 발생시킬 수도 있다.
일부 구현예들에서, 제 1 인자 (1862) (d1) 는 제 1 값 (예컨대, 1) 을 가질 수도 있거나, 제 2 인자 (1882) (d2) 는 제 2 값 (예컨대, 1) 을 가질 수도 있거나, 또는 양자이며, 이는 리샘플링 스테이지들을 우회한다. 예를 들어, 제 1 인자 (1862) (d1) 가 제 1 값 (예컨대, 1) 을 가질 때, 리샘플링된 신호 (1866) 는 디-엠퍼사이징된 신호 (1864) 와 동일할 수도 있다. 다른 예로서, 제 2 인자 (1882) (d2) 가 제 2 값 (예컨대, 1) 을 가질 때, 리샘플링된 신호 (1870) 는 디-엠퍼사이징된 신호 (1868) 와 동일할 수도 있다. 리샘플러 (1810) 는 리샘플링된 신호 (1870) 를 기울기-밸런서 (1812) 로 제공할 수도 있다. 기울기-밸런서 (1812) 는 리샘플링된 신호 (1870) 에 대해 기울기 밸런싱을 수행함으로써 제 1 리샘플링된 신호 (530) 를 발생시킬 수도 있다.
디-엠퍼사이저 (1834) 는 도 6 을 참조하여 설명된 바와 같이, IIR 필터 (예컨대, 1차 IIR 필터) 에 기초하여, 제 2 오디오 신호 (132) 를 필터링함으로써, 디-엠퍼사이징된 신호 (1884) 를 발생시킬 수도 있다. 디-엠퍼사이저 (1834) 는 디-엠퍼사이징된 신호 (1884) 를 리샘플러 (1836) 로 제공할 수도 있다. 리샘플러 (1836) 는 제 1 인자 (1862) (d1) 에 기초하여 디-엠퍼사이징된 신호 (1884) 를 리샘플링함으로써 리샘플링된 신호 (1886) 를 발생시킬 수도 있다. 리샘플러 (1836) 는 리샘플링된 신호 (1886) 를 디-엠퍼사이저 (1838) 로 제공할 수도 있다. 디-엠퍼사이저 (1838) 는 도 6 을 참조하여 설명된 바와 같이, IIR 필터에 기초하여, 리샘플링된 신호 (1886) 를 필터링함으로써, 디-엠퍼사이징된 신호 (1888) 를 발생시킬 수도 있다. 디-엠퍼사이저 (1838) 는 디-엠퍼사이징된 신호 (1888) 를 리샘플러 (1840) 로 제공할 수도 있다. 리샘플러 (1840) 는 제 2 인자 (1882) (d2) 에 기초하여 디-엠퍼사이징된 신호 (1888) 를 리샘플링함으로써, 리샘플링된 신호 (1890) 를 발생시킬 수도 있다.
일부 구현예들에서, 제 1 인자 (1862) (d1) 는 제 1 값 (예컨대, 1) 을 가질 수도 있거나, 제 2 인자 (1882) (d2) 는 제 2 값 (예컨대, 1) 을 가질 수도 있거나, 또는 양자이며, 이는 리샘플링 단계들을 우회한다. 예를 들어, 제 1 인자 (1862) (d1) 가 제 1 값 (예컨대, 1) 을 가질 때, 리샘플링된 신호 (1886) 는 디-엠퍼사이징된 신호 (1884) 와 동일할 수도 있다. 다른 예로서, 제 2 인자 (1882) (d2) 가 제 2 값 (예컨대, 1) 을 가질 때, 리샘플링된 신호 (1890) 는 디-엠퍼사이징된 신호 (1888) 와 동일할 수도 있다. 리샘플러 (1840) 는 리샘플링된 신호 (1890) 를 기울기-밸런서 (1842) 로 제공할 수도 있다. 기울기-밸런서 (1842) 는 리샘플링된 신호 (1890) 에 대해 기울기 밸런싱을 수행함으로써 제 2 리샘플링된 신호 (532) 를 발생시킬 수도 있다. 일부 구현예들에서, 기울기-밸런서 (1812) 및 기울기-밸런서 (1842) 는 각각 디-엠퍼사이저 (1804) 및 디-엠퍼사이저 (1834) 로 인한 저역 통과 (LP) 효과를 보상할 수도 있다.
도 19 를 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 1900 으로 지정된다. 시스템 (1900) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (1900) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
시스템 (1900) 은 시프트 추정기 (1704) 를 포함한다. 시프트 추정기 (1704) 는 신호 비교기 (506), 보간기 (510), 시프트 정제기 (511), 시프트 변화 분석기 (512), 절대 시프트 발생기 (513), 또는 이들의 조합을 포함할 수도 있다. 시스템 (1900) 은 도 19 에 예시된 컴포넌트들보다 적거나 또는 많을 수도 있는 것으로 이해되어야 한다. 시스템 (1900) 은 본원에서 설명되는 하나 이상의 동작들을 수행하도록 구성될 수도 있다. 예를 들어, 시스템 (1900) 은 도 5 의 시간 등화기 (108), 도 17 의 시프트 추정기 (1704), 또는 양자를 참조하여 설명된 하나 이상의 동작들을 수행하도록 구성될 수도 있다. 비-인과적 시프트 값 (162) 은 제 1 오디오 신호 (130), 제 1 리샘플링된 신호 (530), 제 2 오디오 신호 (132), 제 2 리샘플링된 신호 (532), 또는 이들의 조합에 기초하여 발생되는, 하나 이상의 저역-통과 필터링된 신호들, 하나 이상의 고역 통과 필터링된 신호들, 또는 이들의 조합에 기초하여 추정될 수도 있는 것으로 이해되어야 한다.
도 20 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 2000 으로 지정된다. 시스템 (2000) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (2000) 의 하나 이상의 컴포넌트들을 포함할 수도 있다.
시스템 (2000) 은 이득 파라미터 발생기 (514) 를 포함한다. 이득 파라미터 발생기 (514) 는 이득 평활기 (2008) 에 커플링된 이득 추정기 (2002) 를 포함할 수도 있다. 이득 추정기 (2002) 는 엔벨로프-기반 이득 추정기 (2004), 코히어런스-기반 이득 추정기 (2006), 또는 양자를 포함할 수도 있다. 이득 추정기 (2002) 는 도 1 을 참조하여 설명된 바와 같이, 수식들 1a-1f 중 하나 이상에 기초하여 이득을 발생시킬 수도 있다.
동작 동안, 이득 추정기 (2002) 는 제 1 오디오 신호 (130) 가 참조 신호에 대응한다는 것을 참조 신호 표시자 (164) 가 표시한다고 결정하는 것에 응답하여, 참조 신호 (1740) 가 제 1 오디오 신호 (130) 를 포함한다고 결정할 수도 있다. 대안적으로, 이득 추정기 (2002) 는 제 2 오디오 신호 (132) 가 참조 신호에 대응한다는 것을 참조 신호 표시자 (164) 가 표시한다고 결정하는 것에 응답하여, 참조 신호 (1740) 가 제 2 오디오 신호 (132) 를 포함한다고 결정할 수도 있다.
엔벨로프-기반 이득 추정기 (2004) 는 참조 신호 (1740), 조정된 목표 신호 (1752), 또는 양자에 기초하여, 엔벨로프-기반 이득 (2020) 을 발생시킬 수도 있다. 예를 들어, 엔벨로프-기반 이득 추정기 (2004) 는 참조 신호 (1740) 의 제 1 엔벨로프 및 조정된 목표 신호 (1752) 의 제 2 엔벨로프에 기초하여 엔벨로프-기반 이득 (2020) 을 결정할 수도 있다. 엔벨로프-기반 이득 추정기 (2004) 는 엔벨로프-기반 이득 (2020) 을 이득 평활기 (2008) 로 제공할 수도 있다.
코히어런스-기반 이득 추정기 (2006) 는 참조 신호 (1740), 조정된 목표 신호 (1752), 또는 양자에 기초하여, 코히어런스-기반 이득 (2022) 을 발생시킬 수도 있다. 예를 들어, 코히어런스-기반 이득 추정기 (2006) 는 참조 신호 (1740), 조정된 목표 신호 (1752), 또는 양자에 대응하는 추정된 코히어런스를 결정할 수도 있다. 코히어런스-기반 이득 추정기 (2006) 는 추정된 코히어런스에 기초하여 코히어런스-기반 이득 (2022) 을 결정할 수도 있다. 코히어런스-기반 이득 추정기 (2006) 는 코히어런스-기반 이득 (2022) 을 이득 평활기 (2008) 로 제공할 수도 있다.
이득 평활기 (2008) 는 엔벨로프-기반 이득 (2020), 코히어런스-기반 이득 (2022), 제 1 이득 (2060), 또는 이들의 조합에 기초하여 이득 파라미터 (160) 를 발생시킬 수도 있다. 예를 들어, 이득 파라미터 (160) 는 엔벨로프-기반 이득 (2020), 코히어런스-기반 이득 (2022), 제 1 이득 (2060), 또는 이들의 조합의 평균에 대응할 수도 있다. 제 1 이득 (2060) 은 프레임 (302) 과 연관될 수도 있다.
도 21 을 참조하면, 시스템의 예시적인 예가 도시되며, 일반적으로 2100 으로 지정된다. 시스템 (2100) 은 도 1 의 시스템 (100) 에 대응할 수도 있다. 예를 들어, 도 1 의, 시스템 (100), 제 1 디바이스 (104), 또는 양자는 시스템 (2100) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 도 21 은 또한 상태 다이어그램 (2120) 을 포함한다. 상태 다이어그램 (2120) 은 프레임간 시프트 변동 분석기 (1706) 의 동작을 예시할 수도 있다.
상태 다이어그램 (2120) 은 상태 (2102) 에서, 제 2 오디오 신호 (132) 를 표시하도록 도 17 의 목표 신호 표시자 (1764) 를 설정하는 것을 포함한다. 상태 다이어그램 (2120) 은 상태 (2104) 에서, 제 1 오디오 신호 (130) 를 표시하도록 목표 신호 표시자 (1764) 를 설정하는 것을 포함한다. 프레임간 시프트 변동 분석기 (1706) 는 제 1 시프트 값 (962) 이 제 1 값 (예컨대, 제로) 을 가지고 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 상태 (2104) 로부터 상태 (2102) 로 전이할 수도 있다. 예를 들어, 프레임간 시프트 변동 분석기 (1706) 는 제 1 시프트 값 (962) 이 제 1 값 (예컨대, 제로) 을 가지고 최종 시프트 값 (116) 이 제 2 값 (예컨대, 네거티브 값) 을 갖는다고 결정하는 것에 응답하여, 목표 신호 표시자 (1764) 를 제 1 오디오 신호 (130) 를 표시하는 것으로부터 제 2 오디오 신호 (132) 를 표시하는 것으로 변화시킬 수도 있다. 프레임간 시프트 변동 분석기 (1706) 는 제 1 시프트 값 (962) 이 제 1 값 (예컨대, 네거티브 값) 을 가지고 최종 시프트 값 (116) 이 제 2 값 (예컨대, 제로) 을 갖는다고 결정하는 것에 응답하여, 상태 (2102) 로부터 상태 (2104) 로 전이할 수도 있다. 예를 들어, 프레임간 시프트 변동 분석기 (1706) 는 제 1 시프트 값 (962) 이 제 1 값 (예컨대, 네거티브 값) 을 가지고 최종 시프트 값 (116) 이 제 2 값 (예컨대, 제로) 을 갖는다고 결정하는 것에 응답하여, 목표 신호 표시자 (1764) 를 제 2 오디오 신호 (132) 를 표시하는 것으로부터 제 1 오디오 신호 (130) 를 표시하는 것으로 변화시킬 수도 있다. 프레임간 시프트 변동 분석기 (1706) 는 목표 신호 표시자 (1764) 를 목표 신호 조정기 (1708) 로 제공할 수도 있다. 일부 구현예들에서, 프레임간 시프트 변동 분석기 (1706) 는 평활화 및 느린-시프팅을 위해, 목표 신호 표시자 (1764) 에 의해 표시되는 목표 신호 (예컨대, 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132)) 를 목표 신호 조정기 (1708) 로 제공할 수도 있다. 목표 신호는 도 17 의 목표 신호 (1742) 에 대응할 수도 있다.
도 22 를 참조하면, 특정의 동작의 방법을 예시하는 플로우 차트가 도시되며, 일반적으로 2200 으로 지정된다. 방법 (2200) 은 도 1 의, 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (2200) 은 2202 에서, 디바이스에서, 2개의 오디오 채널들을 수신하는 단계를 포함한다. 예를 들어, 도 1 의 입력 인터페이스들 (112) 의 제 1 입력 인터페이스는 제 1 오디오 신호 (130) (예컨대, 제 1 오디오 채널) 를 수신할 수도 있으며, 입력 인터페이스들 (112) 의 제 2 입력 인터페이스는 제 2 오디오 신호 (132) (예컨대, 제 2 오디오 채널) 를 수신할 수도 있다.
방법 (2200) 은 또한 2204 에서, 디바이스에서, 2개의 오디오 채널들 사이의 시간 부정합의 양을 표시하는 부정합 값을 결정하는 단계를 포함한다. 예를 들어, 도 1 의 시간 등화기 (108) 는 도 1 에 대해 설명한 바와 같이, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합의 양을 표시하는 최종 시프트 값 (116) (예컨대, 부정합 값) 을 결정할 수도 있다. 다른 예로서, 시간 등화기 (108) 는 도 14 에 대해 설명한 바와 같이, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합의 양을 표시하는 최종 시프트 값 (116) (예컨대, 부정합 값), 제 1 오디오 신호 (130) 와 제 3 오디오 신호 (1430) 사이의 시간 부정합의 양을 표시하는 제 2 최종 시프트 값 (1416) (예컨대, 부정합 값), 제 1 오디오 신호 (130) 와 제 4 오디오 신호 (1432) 사이의 시간 부정합의 양을 표시하는 제 3 최종 시프트 값 (1418) (예컨대, 부정합 값), 또는 이들의 조합을 결정할 수도 있다. 추가적인 예로서, 시간 등화기 (108) 는 도 15 를 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 부정합의 양을 표시하는 최종 시프트 값 (116) (예컨대, 부정합 값), 제 3 오디오 신호 (1430) 와 제 4 오디오 신호 (1432) 사이의 시간 부정합을 표시하는 제 2 최종 시프트 값 (1516) (예컨대, 부정합 값), 또는 양자를 결정할 수도 있다.
방법 (2200) 은 2206 에서, 부정합 값에 기초하여, 목표 채널 또는 참조 채널 중 적어도 하나를 결정하는 단계를 더 포함한다. 예를 들어, 도 1 의 시간 등화기 (108) 는 도 17 을 참조하여 설명된 바와 같이, 최종 시프트 값 (116) 에 기초하여, 목표 신호 (1742) (예컨대, 목표 채널) 또는 참조 신호 (1740) (예컨대, 참조 채널) 중 적어도 하나를 결정할 수도 있다. 목표 신호 (1742) 는 2개의 오디오 채널들 (예컨대, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 의 지체된 오디오 채널에 대응할 수도 있다. 참조 신호 (1740) 는 2개의 오디오 채널들 (예컨대, 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132)) 의 선행 오디오 채널에 대응할 수도 있다.
방법 (2200) 은 또한 2208 에서, 디바이스에서, 부정합 값에 기초하여 목표 채널을 조정함으로써, 수정된 목표 채널을 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 시간 등화기 (108) 는 도 17 을 참조하여 설명된 바와 같이, 최종 시프트 값 (116) 에 기초하여 목표 신호 (1742) 를 조정함으로써, 조정된 목표 신호 (1752) (예컨대, 수정된 목표 채널) 를 발생시킬 수도 있다.
방법 (2200) 은 또한 2210 에서, 디바이스에서, 참조 채널 및 수정된 목표 채널에 기초하여, 적어도 하나의 인코딩된 신호를 발생시키는 단계를 포함한다. 예를 들어, 도 1 의 시간 등화기 (108) 는 도 17 을 참조하여 설명된 바와 같이, 참조 신호 (1740) (예컨대, 참조 채널) 및 조정된 목표 신호 (1752) (예컨대, 수정된 목표 채널) 에 기초하여, 인코딩된 신호들 (102) 을 발생시킬 수도 있다.
다른 예로서, 시간 등화기 (108) 는 도 14 를 참조하여 설명된 바와 같이, 제 1 오디오 신호 (130) (예컨대, 참조 채널) 의 샘플들 (326-332), 제 2 오디오 신호 (132) (예컨대, 수정된 목표 채널) 의 샘플들 (358-364), 제 3 오디오 신호 (1430) (예컨대, 수정된 목표 채널) 의 제 3 샘플들, 제 4 오디오 신호 (1432) (예컨대, 수정된 목표 채널) 의 제 4 샘플들, 또는 이들의 조합에 기초하여, 제 1 인코딩된 신호 프레임 (1454) 을 발생시킬 수도 있다. 샘플들 (358-364), 제 3 샘플들, 및 제 4 샘플들은 최종 시프트 값 (116), 제 2 최종 시프트 값 (1416), 및 제 3 최종 시프트 값 (1418) 에 기초하는 양 만큼, 샘플들 (326-332) 에 대해 각각 시프트될 수도 있다. 시간 등화기 (108) 는 도 5 및 도 14 를 참조하여 설명된 바와 같이, (참조 채널의) 샘플들 (326-332) 및 (수정된 목표 채널의) 샘플들 (358-364) 에 기초하여, 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 (참조 채널의) 샘플들 (326-332) 및 (수정된 목표 채널의) 제 3 샘플들에 기초하여 제 3 인코딩된 신호 프레임 (1466) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 (참조 채널의) 샘플들 (326-332) 및 (수정된 목표 채널의) 제 4 샘플들에 기초하여 제 4 인코딩된 신호 프레임 (1468) 을 발생시킬 수도 있다.
추가적인 예로서, 시간 등화기 (108) 는 도 5 및 도 15 를 참조하여 설명된 바와 같이, (참조 채널의) 샘플들 (326-332) 및 (수정된 목표 채널의) 샘플들 (358-364) 에 기초하여, 제 1 인코딩된 신호 프레임 (564) 및 제 2 인코딩된 신호 프레임 (566) 을 발생시킬 수도 있다. 시간 등화기 (108) 는 도 15 를 참조하여 설명된 바와 같이, 제 3 오디오 신호 (1430) (예컨대, 참조 채널) 의 제 3 샘플들 및 제 4 오디오 신호 (1432) (예컨대, 수정된 목표 채널) 의 제 4 샘플들에 기초하여, 제 3 인코딩된 신호 프레임 (1564) 및 제 4 인코딩된 신호 프레임 (1566) 을 발생시킬 수도 있다. 제 4 샘플들은 도 15 를 참조하여 설명된 바와 같이, 제 2 최종 시프트 값 (1516) 에 기초하여, 제 3 샘플들에 대해 시프트될 수도 있다.
방법 (2200) 은 따라서, 참조 채널 및 수정된 목표 채널에 기초하여, 인코딩된 신호들을 발생시키는 것을 가능하게 할 수도 있다. 수정된 목표 채널은 부정합 값에 기초하여 목표 채널을 조정함으로써 발생될 수도 있다. 수정된 목표 채널과 참조 채널 사이의 차이는 목표 채널과 참조 채널 사이의 차이보다 낮을 수도 있다. 감소된 차이는 조인트-채널 코딩 효율을 향상시킬 수도 있다.
도 23 을 참조하면, 목표 샘플들을 발생시키는 프로세스 다이어그램 (2300) 이 도시된다. 프로세스 다이어그램 (2300) 과 연관된 동작들은 도 1 의 인코더 (114), 도 2 의 인코더 (214), 또는 양자에 의해 수행될 수도 있다.
2302 에서, 인코더는 참조 채널과 수정된 목표 채널 (194) 사이의 시간 상관을 표시하는 시간 상관 값 (192) 을 결정할 수도 있다. 본원에서 사용될 때, "시간 상관" 은 참조 채널과 수정된 목표 채널 (194) 의 시간 정렬, 참조 채널과 수정된 목표 채널 (194) 의 시간 유사성, 참조 채널과 수정된 목표 채널 (194) 사이의 시간 단기 상관, 참조 채널과 수정된 목표 채널 (194) 사이의 시간 장기 상관, 또는 이들의 조합을 표시할 수도 있다. 제 1 오디오 신호 (130) 가 참조 채널 (예컨대, 2개의 오디오 신호들 (130, 132) 의 선행 오디오 채널) 이고 제 2 오디오 신호 (132) 가 목표 채널 (예컨대, 2개의 오디오 신호들 (130, 132) 의 지체된 오디오 채널) 이면, 수정된 목표 채널 (194) 은 최종 시프트 값 (116) 만큼 비-인과적으로 시프트된 제 2 오디오 신호 (132) 에 대응할 수도 있다.
비한정적인 예로서, 시간 상관 값 (192) 은 제로로부터 1 까지의 범위일 수도 있다. 1 의 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 "강한 상관" 을 표시한다. 예를 들어, 1 의 시간 상관 값 (192) 은 참조 채널 및 수정된 목표 채널 (194) 이 유사하다는 것을 표시할 수도 있다. 제로의 시간 상관 값 (192) 은 참조 채널과 수정된 목표 채널 (194) 사이의 "약한 상관" 을 표시한다. 예를 들어, 제로의 시간 상관 값 (192) 은 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 오정렬된다는 것을 표시할 수도 있다. 하나의 예시적인 구현예들에서, 시간 상관은 단기 시간 상관 및 프레임 간 장기 상관에서의 변동에 기초하여 추정될 수도 있다. 시간 상관은 또한 실제 부정합 값 및 부정합 값에서의 변동에 기초할 수도 있다. 다른 예시적인 구현예들에서, 시간 상관은 코더 유형 (예컨대, 무성음, 유성음, 음악, 비활성 프레임 코딩, 등), 목표 이득 및 프레임 간 목표 이득에서의 변동에 기초할 수도 있다.
2304 에서, 인코더는 시간 상관 값 (192) 이 제 1 임계치를 만족시키는지 여부를 결정할 수도 있다. 비한정적인 예로서, 제 1 임계치는 "0.8" 일 수도 있다. 따라서, 시간 상관 값 (192) 이 "0.8" 이상이면, 시간 상관 값 (192) 은 제 1 임계치를 만족시킬 수도 있다. 다른 구현예들에서, 제 1 임계치는 다른 값, 예컨대 "0.9" 일 수도 있다. 시간 상관 값 (192) 이 제 1 임계치를 만족시키면 (예컨대, 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 정렬되면), 2306 에서, 인코더는 참조 채널에 기초하여 목표 샘플들을 발생시킬 수도 있다. 예를 들어, 인코더는 참조 채널과 연관된 참조 샘플들을 이용하여, 목표 채널을 시간-시프트시킴으로써 발생되는 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다.
시간 상관 값 (192) 이 제 1 임계치를 만족시키지 못하면, 2308 에서, 인코더는 시간 상관 값 (192) 이 제 2 임계치를 만족시키는지 여부를 결정할 수도 있다. 비한정적인 예로서, 제 2 임계치는 "0.1" 일 수도 있다. 따라서, 시간 상관 값 (192) 이 "0.1" 이하이면, 시간 상관 값 (192) 은 제 2 임계치를 만족시키지 못할 수도 있다. 다른 구현예들에서, 제 2 임계치는 다른 값, 예컨대 "0.2" 또는 "0.15" 일 수도 있다. 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못하면 (예컨대, 참조 채널 및 수정된 목표 채널 (194) 이 실질적으로 시간적으로 오정렬되면), 2310 에서, 인코더는 참조 채널과 독립적으로 목표 샘플들을 발생시킬 수도 있다. 예를 들어, 인코더는 2308 에서의, 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 손실된 목표 샘플들 (196) 의 발생에서 참조 채널의 사용을 우회할 수도 있다. 일 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 선형 예측 필터를 이용하여 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여 제로 값들로 설정될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 수정된 목표 채널 (194) 로부터 외삽될 수도 있다.
시간 상관 값 (192) 이 제 2 임계치를 만족시키고 제 1 임계치를 만족시키지 못하면, 인코더는 2312 에서, 참조 채널에 부분적으로 기초하여 그리고 참조 채널과는 부분적으로 독립적으로, 목표 샘플들을 발생시킬 수도 있다. 비한정적인 예로서, 시간 상관 값 (192) 이 "0.8" 과 "0.1" 사이이면, 인코더는 제 1 가중치 (w1) 를 참조 채널의 참조 샘플들에 기초하여 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있으며, 제 2 가중치 (w2) 를 참조 채널과는 독립적으로 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있다. 일부 구현예들에서, 제 2 임계치 및 제 1 임계치는 동일할 수도 있으며, 목표 신호 손실 샘플 발생의 선택은 참조 채널에 기초하거나 또는 참조 채널과는 독립적이다.
일부 구현예들에서, 제 1 및 제 2 임계치들의 값들은 고정된 값들과는 달리, 인코더 (214) 에서의 파라미터들에 기초한다. 예를 들어, 제 1 및 제 2 임계치들의 값들은 코더 유형 (예컨대, 무성음, 유성음, 음악, 비활성 프레임 코딩, 등), 목표 이득, 및 프레임 간 목표 이득에서의 변동에 기초할 수도 있다.
다른 예시적인 구현예들에서, 코더 유형 (예컨대, 무성음, 유성음, 음악, 활성 음성/음악, 비활성 배경 잡음 프레임들) 에 기초하여, 손실된 목표 샘플들은 참조 채널에 기초하여 또는 참조 채널과 독립적으로 발생될 수도 있다. 2304 에서, 인코더 (214) 는 입력 프레임 (예컨대, 현재의 프레임 또는 이전 프레임) 이 음성 프레임 또는 음악/배경 잡음 프레임인지 여부를 결정할 수도 있다. 비한정적인 예로서, 입력 프레임이 깨끗한 음성 프레임인 것으로 결정되면, 2306 에서, 인코더 (214) 는 참조 채널에 기초하여 목표 샘플들을 발생시킬 수도 있다. 예를 들어, 인코더 (214) 는 참조 채널과 연관된 참조 샘플들을 이용하여, 목표 채널을 시간-시프트시킴으로써 발생되는 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다.
2308 에서, 입력 프레임이 음악 프레임 또는 배경 잡음인 것으로 결정되면, 2310 에서, 인코더 (214) 는 참조 채널과는 독립적으로 목표 샘플들을 발생시키거나 또는 수정할 수도 있다. 예를 들어, 인코더 (214) 는 2308 에서의, 입력 프레임이 음악/배경 잡음 프레임인 것으로 결정된다는 결정에 응답하여, 손실된 목표 샘플들의 발생 또는 목표 샘플들 (196) 을 수정/업데이트할 때 참조 채널의 사용을 우회할 수도 있다. 일 구현예에 따르면, 손실된 목표 샘플들 (196) 은 선형 예측 필터를 이용하여 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 제로 값들로 설정될 수도 있다. 다른 구현예에 따르면, 손실된 목표 샘플들 (196) 은 수정된 목표 채널 (194) 로부터 외삽될 수도 있다. 다른 구현예에서, 목표 샘플들 (196) 의 업데이트는 적어도 채널간 레벨 차이 (ILD), 또는 채널간 에너지들의 비, 또는 채널간 시간 차이 (ICTD) 에 기초한다.
2308 에서, 입력 프레임이 시끄러운 음성 또는 혼합된 음악 프레임인 것으로 결정되면, 2312 에서, 인코더 (214) 는 참조 채널에 부분적으로 기초하여 그리고 참조 채널과는 부분적으로 독립적으로, 목표 샘플들을 발생시킬 수도 있다. 비한정적인 예로서, 입력 프레임이 (예컨대, 장기 잡음 레벨 또는 신호-대-잡음비에 기초하여 결정된) 시끄러운 음성이면, 인코더 (214) 는 제 1 가중치 (w1) 를 참조 채널의 참조 샘플들을 기초하여 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있으며, 제 2 가중치 (w2) 를 참조 채널과는 독립적으로 손실된 목표 샘플들 (196) 을 발생시키는 알고리즘에 적용할 수도 있다. 일부 구현예들에서, 제 2 임계치 및 제 1 임계치는 동일할 수도 있으며, 목표 신호 손실 샘플 발생의 선택은 참조 채널에 기초하거나 또는 참조 채널과는 독립적이다.
다른 구현예에서, 손실된 목표 샘플들의 발생은 코더 유형이 음성 또는 음악 또는 배경 잡음인지 여부와 시간 상관이 제 1 및 제 2 임계치들 중 하나를 만족시키는지 여부의 조합에 기초할 수도 있다.
도 24 를 참조하면, 목표 샘플들을 발생시키는 방법 (2400) 이 도시된다. 방법 (2400) 은 도 1 의 인코더 (114), 도 2 의 인코더 (214), 또는 양자에 의해 수행될 수도 있다.
방법 (2400) 은 2402 에서, 인코더에서 2개 이상의 채널들을 수신하는 단계를 포함한다. 예를 들어, 도 1 을 참조하면, 인코더 (114) 는 제 1 마이크로폰 (146) 으로부터 제 1 오디오 신호 (130) 를 수신할 수도 있으며, 제 2 마이크로폰 (148) 으로부터 제 2 오디오 신호 (132) 를 수신할 수도 있다.
방법 (2400) 은 또한 2404 에서, 목표 채널 및 참조 채널을 식별하는 단계를 포함한다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된다. 일 구현예에 따르면, 목표 채널은 참조 채널로부터 발생될 (예컨대, 추정되거나 또는 유도될) 수 있는 오디오 채널에 대응할 수도 있다. 목표 채널은 2개의 오디오 채널들의 지체된 채널일 수도 있으며, 참조 채널은 2개의 오디오 채널들의 공간적으로 지배적인 채널에 대응할 수도 있다. 예를 들어, 인코더 (114) 는 제 1 오디오 신호 (130) 가 목표 채널이고 제 2 오디오 신호 (132) 가 참조 채널이라고 결정할 수도 있다. 하나의 예시적인 구현예들에서, 인코더 (114) 는 제 1 오디오 신호 (130) 가 지체된 오디오 채널이고 제 2 오디오 신호 (132) 가 선행 오디오 채널이라고 결정할 수도 있다.
방법 (2400) 은 또한 2406 에서, 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 단계를 포함한다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시한다. 예를 들어, 시간 등화기 (108) 는 제 1 오디오 신호 (130) (예컨대, 방법 (2400) 에 따른 목표 채널) 를 최종 시프트 값 (116) 만큼 시간적으로 조정함으로써 수정된 목표 채널 (194) 을 발생시킬 수도 있다.
방법 (2400) 은 또한 2408 에서, 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 단계를 포함한다. 참조 프레임은 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함할 수도 있다. 목표 프레임은 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함할 수도 있다. 예를 들어, 인코더 (114) 는 시간 유사성을 표시하는 시간 상관 값 (192), 및 제 2 오디오 신호 (132) 의 프레임 (344) (예컨대, 참조 채널의 참조 프레임) 과 최종 시프트 값 (116) 만큼 시프트된 제 1 오디오 신호 (130) 의 프레임 (304) (예컨대, 수정된 목표 채널 (194) 의 목표 프레임) 사이의 단기/장기 상관을 결정할 수도 있다. 프레임 (344) 은 제 2 오디오 신호 (132) 의 제 1 부분과 연관된 제 1 참조 샘플들 (예컨대, 샘플들 (358, 360, 362)) 및 제 2 오디오 신호 (132) 의 제 2 부분과 연관된 제 2 참조 샘플들 (예컨대, 샘플들 (364)) 을 포함할 수도 있다. 프레임 (304) 은 제 1 오디오 신호 (130) 의 제 1 부분과 연관된 제 1 목표 샘플들 (예컨대, 샘플들 (328, 330, 332)) 을 포함할 수도 있다. 이 구체적인 예에서, 도 3, 제 1 샘플들 (320) 은 비-인과적으로 시프트된 목표 신호로서 보여지고, 제 2 샘플들 (350) 은 참조 신호로서 보여진다.
방법 (2400) 은 또한 2410 에서, 시간 상관 값을 임계치와 비교하는 단계를 포함한다. 예를 들어, 인코더 (114) 는 시간 상관 값 (192) 을 임계치와 비교할 수도 있다. 방법 (2400) 은 또한 2412 에서, 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여, 손실된 목표 샘플들을 발생시키는 단계를 포함할 수도 있다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다. 일부 구현예들에 따르면, 방법 (2400) 은 비교에 기초하여 참조 채널이 손실된 목표 샘플들을 발생시키는데 사용되는 방법을 선택하는 단계를 포함한다. 본원에서 사용될 때, 손실된 목표 샘플들을 발생시키기 위해 참조 채널을 이용하는 "방법" 을 선택하는 것은 복수의 목표 샘플 발생 방식들 중에서 목표 샘플 발생 방식을 선택하는 것을 포함할 수도 있다.
예시하기 위하여, 복수의 목표 샘플 발생 방식들은 손실된 목표 샘플들 (334) 이 참조 채널에 기초하여 발생되는 제 1 방식, 손실된 목표 샘플들 (334) 이 선형 예측 필터를 이용하여 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생되는 제 2 방식, 또는 손실된 목표 샘플들 (334) 이 수정된 목표 채널 (194) 을 (예컨대, 제로에 의해) 스케일링하는 것에 의해 발생되는 제 3 방식을 포함할 수도 있다. 복수의 목표 샘플 발생 방식들은 또한 손실된 목표 샘플들 (334) 이 수정된 목표 채널 (194) 로부터 외삽되는 제 4 방식 또는 손실된 목표 샘플들 (334) 이 참조 채널에 부분적으로 기초하여 그리고 선형 예측 필터를 이용하여 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 부분적으로 기초하여 발생되는 제 5 방식을 포함할 수도 있다. 복수의 목표 샘플 발생 방식들은 또한 손실된 목표 샘플들이 참조 채널에 부분적으로 기초하여 그리고 수정된 목표 채널 (194) 를 (예컨대, 제로에 의해) 스케일링하는 것에 부분적으로 기초하여 발생되는 제 6 방식 또는 손실된 목표 샘플들 (334) 이 참조 채널에 부분적으로 기초하여 그리고 수정된 목표 채널 (194) 로부터의 외삽들에 부분적으로 기초하여 발생되는 제 7 방식을 포함할 수도 있다. 따라서, 손실된 목표 샘플들을 발생시키기 위해 참조 채널을 이용하는 "방법" 을 선택하는 것은 또한 목표 참조 샘플들의 발생에서 참조 채널을 이용할지 "여부" 를 선택하는 것을 포함할 수도 있다.
시간 상관 값 (192) 이 제 1 임계치를 만족시킨다고 인코더 (114) 가 결정하면, 인코더 (114) 는 제 2 오디오 신호 (132) (예컨대, 참조 채널) 에 기초하여 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 그러나, 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다고 인코더 (114) 가 결정하면, 인코더 (114) 는 제 2 오디오 신호 (132) 를 이용함이 없이, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 예를 들어, 인코더 (114) 는 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 선형 예측 필터를 이용하여 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 다른 예로서, 인코더 (114) 는 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 수정된 목표 채널 (194) 을 제로 값들로 스케일링함으로써 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다. 다른 예로서, 손실된 목표 샘플들 (196) 은 시간 상관 값 (192) 이 제 2 임계치를 만족시키지 못한다는 결정에 응답하여, 수정된 목표 채널 (194) 로부터 외삽될 수도 있다.
일 구현예에 따르면, 방법 (2400) 은 시간 상관 값 (192) 이 제 1 임계치 (예컨대, 강한 상관 임계치) 를 만족시키지 못하고 시간 상관 값 (192) 이 제 1 임계치보다 낮은 제 2 임계치 (예컨대, 약한 상관 임계치) 를 만족시킨다고 결정하는 단계를 포함할 수도 있다. 비한정적인 예로서, 인코더 (114) 는 시간 상관 값 (192) 이 "0.8" 미만이고 "0.1" 초과라고 결정할 수도 있다. 그 결과, 인코더 (114) 는 참조 채널 (예컨대, 제 2 오디오 신호 (132)) 에 부분적으로 기초하여 그리고 수정된 목표 채널 (194) 의 샘플들의 과거 세트로부터 필터링된 무작위 잡음, 제로 값들, 또는 수정된 목표 채널 (194) 로부터의 외삽들에 부분적으로 기초하여, 손실된 목표 샘플들 (196) 을 발생시킬 수도 있다.
방법 (2400) 의 일 구현예에 따르면, 단일 임계치가 손실된 목표 샘플들 (196) 이 발생되는 방법을 결정하는데 사용될 수도 있다. 단일 임계치의 비한정적인 예는 "0.5" 일 수도 있다. 그러나, 다른 구현예들에서, 상이한 값들이 단일 임계치, 예컨대 "0.6", "0.65", "0.7", 등에 대해 사용될 수도 있다. 시간 상관 값 (192) 이 단일 임계치를 만족시키면 (예컨대, 단일 임계치 이상이면), 손실된 목표 샘플들 (196) 은 참조 채널을 이용하여 발생될 수도 있다. 그러나, 시간 상관 값 (192) 이 단일 임계치를 만족시키지 못하면, 손실된 목표 샘플들 (196) 은 이전 목표 프레임으로부터 필터링된 무작위 잡음에 기초하여, 목표 채널의 외삽에 기초하여, 제로 값들에 기초하여, 또는 이들의 조합에 기초하여 발생될 수도 있다.
방법 (2400) 의 다른 구현예에 따르면, 3개 이상의 임계치들이 손실된 목표 샘플들 (196) 이 발생되는 방법을 결정하는데 사용될 수도 있다. 비한정적인 예로서, 제 1 임계치 (예컨대, 강한 상관 임계치) 가 만족되면, 손실된 목표 샘플들 (196) 은 참조 채널에 기초하여 발생될 수도 있다. 제 1 임계치가 만족되지 않고 제 2 임계치 (예컨대, 매체 상관 임계치) 가 만족되면, 손실된 목표 샘플들 (196) 은 이전 목표 프레임으로부터 필터링된 무작위 잡음에 기초하여 발생될 수도 있다. 제 1 임계치도 제 2 임계치도 만족되지 않고 제 3 임계치 (예컨대, 낮은 상관 임계치) 가 만족되면, 손실된 목표 샘플들 (196) 은 목표 채널로부터의 외삽들에 기초하여 발생될 수도 있다. 추가적으로, 제 1 임계치, 제 2 임계치도, 제 3 임계치도 만족되지 않고 제 4 임계치 (예컨대, 마이크로 상관 임계치) 가 만족되면, 손실된 목표 샘플들 (196) 은 제로 값들로 설정될 수도 있다. 위에서 제시된 시나리오들은 단지 예시적인 목적들을 위한 것이며 한정하는 것으로 해석되지 않아야 하는 것으로 이해되어야 한다. 다른 구현예들에서, 손실된 목표 샘플들 (196) 을 발생시키는 상이한 기법들이 상이한 임계치들에 대해 적용될 수도 있다. 비한정적인 예로서, 손실된 목표 샘플들 (196) 은 제 1 임계치도 제 2 임계치도 만족되지 않고 제 3 임계치 (예컨대, 낮은 상관 임계치) 가 만족되면, 제로 값들로 설정될 수도 있다.
다른 구현예에 따르면, 방법 (2400) 은 또한 프레임을 제 1 디바이스로부터 제 2 디바이스로 전송하는 단계를 포함할 수도 있다. 프레임은 참조 프레임과 연관된 제 1 참조 샘플들, 참조 프레임과 연관된 제 2 참조 샘플들, 목표 프레임과 연관된 제 1 목표 샘플들, 및 목표 프레임과 연관된 손실된 목표 샘플들 (196) 을 포함할 수도 있다. 예를 들어, 도 1 을 참조하면, 제 1 디바이스 (104) 는 프레임을 제 2 디바이스 (106) 로 인코딩된 신호들 (102) 의 베어 (bare) 로서 전송할 수도 있다.
도 25 를 참조하면, 디바이스 (예컨대, 무선 통신 디바이스) 의 특정의 예시적인 예의 블록도가 도시되며 일반적으로 2500 으로 표시된다. 다양한 양태들에서, 디바이스 (2500) 는 도 25 에 예시된 컴포넌트들보다 더 적거나 또는 더 많은 컴포넌트들을 가질 수도 있다. 예시적인 양태에서, 디바이스 (2500) 는 도 1 의 제 1 디바이스 (104) 또는 제 2 디바이스 (106) 에 대응할 수도 있다. 예시적인 양태에서, 디바이스 (2500) 는 도 1 내지 도 24 의 시스템들 및 방법들을 참조하여 설명된 하나 이상의 동작들을 수행할 수도 있다.
특정한 양태에서, 디바이스 (2500) 는 프로세서 (2506) (예컨대, 중앙 처리 유닛 (CPU)) 를 포함한다. 디바이스 (2500) 는 하나 이상의 추가적인 프로세서들 (2510) (예컨대, 하나 이상의 디지털 신호 프로세서들 (DSPs)) 을 포함할 수도 있다. 프로세서들 (2510) 은 미디어 (예컨대, 음성 및 음악) 코더-디코더 (코덱) (2508), 및 에코 소거기 (2512) 를 포함할 수도 있다. 미디어 코덱 (2508) 은 도 1 의, 디코더 (118), 인코더 (114), 또는 양쪽을 포함할 수도 있다. 인코더 (114) 는 시간 등화기 (108) 를 포함할 수도 있다.
디바이스 (2500) 는 메모리 (153) 및 코덱 (2534) 을 포함할 수도 있다. 미디어 코덱 (2508) 이 프로세서들 (2510) 의 컴포넌트 (예컨대, 전용 회로부 및/또는 실행가능한 프로그래밍 코드) 로서 예시되지만, 다른 양태들에서, 디코더 (118), 인코더 (114), 또는 양쪽과 같은, 미디어 코덱 (2508) 의 하나 이상의 컴포넌트들이 프로세서 (2506), 코덱 (2534), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다.
디바이스 (2500) 는 안테나 (2542) 에 커플링된 송신기 (110) 를 포함할 수도 있다. 디바이스 (2500) 는 디스플레이 제어기 (2526) 에 커플링된 디스플레이 (2528) 를 포함할 수도 있다. 하나 이상의 스피커들 (2548) 이 코덱 (2534) 에 커플링될 수도 있다. 하나 이상의 마이크로폰들 (2546) 이 입력 인터페이스(들) (112) 를 통해서, 코덱 (2534) 에 커플링될 수도 있다. 특정한 양태에서, 스피커들 (2548) 은 도 1 의, 제 1 라우드스피커 (142), 제 2 라우드스피커 (144), 도 2 의 제 Y 라우드스피커 (244), 또는 이들의 조합을 포함할 수도 있다. 특정의 양태에서, 마이크로폰들 (2546) 은 도 1 의, 제 1 마이크로폰 (146), 제 2 마이크로폰 (148), 도 2 의 제 N 마이크로폰 (248), 도 11 의, 제 3 마이크로폰 (1146), 제 4 마이크로폰 (1148), 또는 이들의 조합을 포함할 수도 있다. 코덱 (2534) 은 디지털-대-아날로그 변환기 (DAC) (2502) 및 아날로그-대-디지털 변환기 (ADC) (2504) 를 포함할 수도 있다.
메모리 (153) 는 프로세서 (2506), 프로세서들 (2510), 코덱 (2534), 디바이스 (2500) 의 다른 프로세싱 유닛, 또는 이들의 조합에 의해 실행가능한, 도 1 내지 도 24 를 참조하여 설명된 하나 이상의 동작들을 수행하는 명령들 (2560) 을 포함할 수도 있다. 메모리 (153) 는 분석 데이터 (190) 를 저장할 수도 있다.
일 구현예에 따르면, 명령들 (2560) 은 프로세서 (예컨대, 프로세서 (2506), 프로세서 (2510), 또는 인코더 (114)) 로 하여금, 2개의 오디오 채널들 (예컨대, 오디오 채널들 (130), (132)) 을 수신하는 것 및 목표 채널 및 참조 채널을 식별하는 것을 포함하는 동작들을 수행하게 하도록 실행가능할 수도 있다. 목표 채널은 참조 채널로부터 발생될 (예컨대, 추정되거나 또는 유도될) 수 있는 오디오 채널에 대응할 수도 있다. 목표 채널은 2개의 오디오 채널들의 지체된 채널일 수도 있으며, 참조 채널은 2개의 오디오 채널들의 공간적으로 지배적인 채널에 대응할 수도 있다. 동작들은 또한 부정합 값 (예컨대, 최종 시프트 값 (116)) 에 기초하여 목표 채널을 시간적으로 시프트시킴으로써 수정된 목표 채널 (예컨대, 수정된 목표 채널 (194)) 을 발생시키는 것을 포함할 수도 있다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시할 수도 있다. 동작들은 또한 시간 유사성을 표시하는 시간 상관 값 (예컨대, 시간 상관 값 (192)) 및 참조 채널의 참조 프레임과 수정된 목표 채널의 대응하는 목표 프레임 사이의 단기 및 장기 상관을 결정하는 것을 포함할 수도 있다. 참조 프레임은 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함할 수도 있다. 목표 프레임은 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함할 수도 있다. 동작들은 또한 시간 상관 값 (192) 에 기초하여, 목표 프레임의 제 2 부분과 연관된 손실된 목표 샘플들 (예컨대, 손실된 목표 샘플들 (196)) 을 발생시키기 위해 참조 채널을 이용하는 방법을 선택하는 것을 포함할 수도 있다. 동작들은 선택에 기초하여, 손실된 목표 샘플들을 발생시키는 것을 더 포함할 수도 있다.
디바이스 (2500) 의 하나 이상의 컴포넌트들은 하나 이상의 태스크들, 또는 이들의 조합을 수행하는 명령들을 실행하는 프로세서에 의해, 전용 하드웨어 (예컨대, 회로부) 를 통해서 구현될 수도 있다. 일 예로서, 메모리 (153) 또는 프로세서 (2506), 프로세서들 (2510), 및/또는 코덱 (2534) 의 하나 이상의 컴포넌트들은 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 전송 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈식 디스크, 또는 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은, 메모리 디바이스 (예컨대, 컴퓨터 판독가능 저장 디바이스) 일 수도 있다. 메모리 디바이스는 컴퓨터 (예컨대, 코덱 (2534) 내 프로세서, 프로세서 (2506), 및/또는 프로세서들 (2510)) 에 의해 실행될 때, 컴퓨터로 하여금, 도 1 내지 도 24 를 참조하여 설명된 하나 이상의 동작들을 수행하게 할 수도 있는 명령들 (예컨대, 명령들 (2560)) 을 포함할 (예컨대, 저장할) 수도 있다. 일 예로서, 메모리 (153) 또는 프로세서 (2506), 프로세서들 (2510), 및/또는 코덱 (2534) 의 하나 이상의 컴포넌트들은 컴퓨터 (예컨대, 코덱 (2534) 내 프로세서, 프로세서 (2506), 및/또는 프로세서들 (2510)) 에 의해 실행될 때, 컴퓨터로 하여금, 도 1 내지 도 24 를 참조하여 설명된 하나 이상의 동작들을 수행하게 하는 명령들 (예컨대, 명령들 (2560)) 을 포함하는 비일시적 컴퓨터 판독가능 매체일 수도 있다.
특정한 양태에서, 디바이스 (2500) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (예컨대, 이동국 모뎀 (MSM)) (2522) 에 포함될 수도 있다. 특정한 양태에서, 프로세서 (2506), 프로세서들 (2510), 디스플레이 제어기 (2526), 메모리 (153), 코덱 (2534), 및 송신기 (110) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2522) 에 포함된다. 특정한 양태에서, 터치스크린 및/또는 키패드와 같은 입력 디바이스 (2530), 및 전원 (2544) 은 시스템-온-칩 디바이스 (2522) 에 커플링된다. 더욱이, 특정한 양태에서, 도 25 에 예시된 바와 같이, 디스플레이 (2528), 입력 디바이스 (2530), 스피커들 (2548), 마이크로폰들 (2546), 안테나 (2542), 및 전원 (2544) 은 시스템-온-칩 디바이스 (2522) 의 외부에 있다. 그러나, 디스플레이 (2528), 입력 디바이스 (2530), 스피커들 (2548), 마이크로폰들 (2546), 안테나 (2542), 및 전원 (2544) 각각은 인터페이스 또는 제어기와 같은, 시스템-온-칩 디바이스 (2522) 의 컴포넌트에 커플링될 수 있다.
디바이스 (2500) 는 무선 전화기, 모바일 통신 디바이스, 모바일 디바이스, 모바일 폰, 스마트 폰, 셀룰러폰, 랩탑 컴퓨터, 데스크탑 컴퓨터, 컴퓨터, 태블릿 컴퓨터, 셋 탑 박스, 개인 휴대정보 단말기 (PDA), 디스플레이 디바이스, 텔레비전, 게이밍 콘솔, 뮤직 플레이어, 라디오, 비디오 플레이어, 엔터테인먼트 유닛, 통신 디바이스, 고정 로케이션 데이터 유닛, 개인 미디어 플레이어, 디지털 비디오 플레이어, 디지털 비디오 디스크 (DVD) 플레이어, 튜너, 카메라, 네비게이션 디바이스, 디코더 시스템, 인코더 시스템, 또는 이들의 임의의 조합을 포함할 수도 있다.
특정한 양태에서, 도 1 내지 도 24 를 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (2500) 는 디코딩 시스템 또는 장치 (예컨대, 전자 디바이스, 코덱, 또는 그 내부의 프로세서) 에, 인코딩 시스템 또는 장치에, 또는 양쪽에 통합될 수도 있다. 다른 양태들에서, 도 1 내지 도 24 를 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (2500) 는 무선 전화기, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 셋 탑 박스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 텔레비전, 게임 콘솔, 네비게이션 디바이스, 통신 디바이스, 개인 휴대정보 단말기 (PDA), 고정된 로케이션 데이터 유닛, 개인 미디어 플레이어, 또는 다른 유형의 디바이스에 통합될 수도 있다.
도 1 내지 도 24 를 참조하여 설명된 시스템들의 하나 이상의 컴포넌트들 및 디바이스 (2500) 에 의해 수행되는 다양한 기능들이 어떤 컴포넌트들 또는 모듈들에 의해 수행되는 것으로 설명된다는 점에 유의해야 한다. 컴포넌트들 및 모듈들의 이러한 분할은 단지 예시를 위한 것이다. 대안적인 양태에서, 특정의 컴포넌트 또는 모듈에 의해 수행되는 기능은 다수의 컴포넌트들 또는 모듈들 간에 분할될 수도 있다. 더욱이, 대안적인 양태에서, 도 1 내지 도 24 를 참조하여 설명된 2개 이상의 컴포넌트들 또는 모듈들은 단일 컴포넌트 또는 모듈로 통합될 수도 있다. 도 1 내지 도 24 를 참조하여 설명된 각각의 컴포넌트 또는 모듈은 하드웨어 (예컨대, 필드-프로그래밍가능 게이트 어레이 (FPGA) 디바이스, 주문형 집적 회로 (ASIC), DSP, 제어기, 등), 소프트웨어 (예컨대, 프로세서에 의해 실행가능한 명령들), 또는 이들의 임의의 조합을 이용하여 구현될 수도 있다.
설명되는 양태들과 관련하여, 장치는 2개 이상의 채널들을 수신하는 수단을 포함한다. 예를 들어, 2개의 오디오 채널들을 수신하는 수단은 도 1 의 제 1 마이크로폰 (146), 도 1 의 제 2 마이크로폰 (148), 도 25 의 마이크로폰들 (2546), 또는 이들의 임의의 조합을 포함할 수도 있다.
본 장치는 또한 목표 채널 및 참조 채널을 식별하는 수단을 포함할 수도 있다. 목표 채널 및 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별될 수도 있다. 목표 채널은 참조 채널로부터 발생될 (예컨대, 추정되거나 또는 유도될) 수 있는 오디오 채널에 대응할 수도 있다. 목표 채널은 2개의 오디오 채널들의 지체된 채널일 수도 있으며, 참조 채널은 2개의 오디오 채널들의 공간적으로 지배적인 채널에 대응할 수도 있다. 예를 들어, 식별하는 수단은 도 1 의 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 미디어 코덱 (2508), 프로세서들 (2510), 디바이스 (2500), 부정합 값을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터 판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 부정합 값에 기초하여 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 수단을 포함할 수도 있다. 부정합 값은 목표 채널과 참조 채널 사이의 시간 부정합의 양을 표시할 수도 있다. 예를 들어, 수정된 목표 채널을 발생시키는 수단은 도 1 의 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 미디어 코덱 (2508), 프로세서들 (2510), 디바이스 (2500), 부정합 값을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터 판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 참조 채널과 연관된 제 1 신호와 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 수단을 포함할 수도 있다. 참조 프레임은 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함할 수도 있다. 목표 프레임은 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함할 수도 있다. 예를 들어, 시간 상관 값을 결정하는 수단은 도 1 의 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 미디어 코덱 (2508), 프로세서들 (2510), 디바이스 (2500), 부정합 값을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터 판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 시간 상관 값을 임계치와 비교하는 수단을 포함할 수도 있다. 예를 들어, 비교하는 수단은 도 1 의 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 미디어 코덱 (2508), 프로세서들 (2510), 디바이스 (2500), 부정합 값을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터 판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
본 장치는 또한 이 비교에 기초하여, 참조 채널에 기초한 참조 프레임 또는 수정된 목표 채널에 기초한 목표 채널 중 적어도 하나를 이용하여, 손실된 목표 샘플들을 발생시키는 수단을 포함할 수도 있다. 제 1 신호는 참조 프레임의 부분에 대응하며, 제 2 신호는 목표 프레임의 부분에 대응한다. 예를 들어, 발생시키는 수단은 도 1 의 시간 등화기 (108), 인코더 (114), 제 1 디바이스 (104), 미디어 코덱 (2508), 프로세서들 (2510), 디바이스 (2500), 부정합 값을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 컴퓨터 판독가능 저장 디바이스에 저장된 명령들을 실행하는 프로세서), 또는 이들의 조합을 포함할 수도 있다.
도 26 을 참조하면, 기지국 (2600) 의 특정의 예시적인 예의 블록도가 도시된다. 여러 구현예들에서, 기지국 (2600) 은 도 26 에 예시된 것보다 더 많은 컴포넌트들 또는 더 적은 컴포넌트들을 가질 수도 있다. 예시적인 예에서, 기지국 (2600) 은 도 1 의 제 1 디바이스 (104), 제 2 디바이스 (106), 도 2 의 제 1 디바이스 (204), 또는 이들의 조합을 포함할 수도 있다. 예시적인 예에서, 기지국 (2600) 은 도 1 내지 도 23 를 참조하여 설명된 방법들 또는 시스템들 중 하나 이상에 따라서 동작할 수도 있다.
기지국 (2600) 은 무선 통신 시스템의 부분일 수도 있다. 무선 통신 시스템은 다수의 기지국들 및 다수의 무선 디바이스들을 포함할 수도 있다. 무선 통신 시스템은 롱텀 에볼류션 (LTE) 시스템, 코드분할 다중접속 (CDMA) 시스템, GSM (Global System for Mobile Communications) 시스템, 무선 로컬 영역 네트워크 (WLAN) 시스템, 또는 어떤 다른 무선 시스템일 수도 있다. CDMA 시스템은 광대역 CDMA (WCDMA), CDMA 1X, EVDO (Evolution-Data Optimized), 시분할 동기 CDMA (TD-SCDMA), 또는 CDMA 의 어떤 다른 버전을 구현할 수도 있다.
무선 디바이스들은 또한 사용자 장비 (UE), 이동국, 단말기, 액세스 단말기, 가입자 유닛, 스테이션, 등으로서 지칭될 수도 있다. 무선 디바이스들은 셀룰러폰, 스마트폰, 태블릿, 무선 모뎀, 개인 휴대정보 단말기 (PDA), 핸드헬드 디바이스, 랩탑 컴퓨터, 스마트북, 넷북, 태블릿, 코드리스 폰, 무선 가입자 회선 (WLL) 국, 블루투스 디바이스, 등을 포함할 수도 있다. 무선 디바이스들은 도 23 의 디바이스 (2300) 를 포함하거나 또는 그에 대응할 수도 있다.
메시지들 및 데이터 (예컨대, 오디오 데이터) 를 전송하고 수신하는 것과 같은, 여러 기능들이 기지국 (2600) 의 하나 이상의 컴포넌트들에 의해 (및/또는 미도시된 다른 컴포넌트들에서) 수행될 수도 있다. 특정의 예에서, 기지국 (2600) 은 프로세서 (2606) (예컨대, CPU) 를 포함한다. 기지국 (2600) 은 트랜스코더 (2610) 를 포함할 수도 있다. 트랜스코더 (2610) 는 오디오 코덱 (2608) 을 포함할 수도 있다. 예를 들어, 트랜스코더 (2610) 는 오디오 코덱 (2608) 의 동작들을 수행하도록 구성된 하나 이상의 컴포넌트들 (예컨대, 회로부) 을 포함할 수도 있다. 다른 예로서, 트랜스코더 (2610) 는 오디오 코덱 (2608) 의 동작들을 수행하는 하나 이상의 컴퓨터 판독가능 명령들을 실행하도록 구성될 수도 있다. 오디오 코덱 (2608) 이 트랜스코더 (2610) 의 컴포넌트로서 예시되지만, 다른 예들에서, 오디오 코덱 (2608) 의 하나 이상의 컴포넌트들이 프로세서 (2606), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다. 예를 들어, 디코더 (2638) (예컨대, 보코더 디코더) 는 수신기 데이터 프로세서 (2664) 에 포함될 수도 있다. 다른 예로서, 인코더 (2636) (예컨대, 보코더 인코더) 는 송신 데이터 프로세서 (2682) 에 포함될 수도 있다.
트랜스코더 (2610) 는 2개 이상의 네트워크들 사이에서 메시지들 및 데이터를 트랜스코딩하도록 기능할 수도 있다. 트랜스코더 (2610) 는 메시지 및 오디오 데이터를 제 1 포맷 (예컨대, 디지털 포맷) 으로부터 제 2 포맷으로 변환하도록 구성될 수도 있다. 예시하기 위하여, 디코더 (2638) 는 제 1 포맷을 가지는 인코딩된 신호들을 디코딩할 수도 있으며, 인코더 (2636) 는 디코딩된 신호들을 제 2 포맷을 가지는 인코딩된 신호들로 인코딩할 수도 있다. 추가적으로 또는 대안적으로, 트랜스코더 (2610) 는 데이터 레이트 적응을 수행하도록 구성될 수도 있다. 예를 들어, 트랜스코더 (2610) 는 오디오 데이터의 포맷을 변경함이 없이, 데이터 레이트를 상향변환하거나 또는 데이터 레이트를 하향변환할 수도 있다. 예시하기 위하여, 트랜스코더 (2610) 는 64 kbit/s 신호들을 16 kbit/s 신호들로 하향변환할 수도 있다.
오디오 코덱 (2608) 은 인코더 (2636) 및 디코더 (2638) 를 포함할 수도 있다. 인코더 (2636) 는 도 1 의 인코더 (114), 도 2 의 인코더 (214), 또는 양쪽을 포함할 수도 있다. 디코더 (2638) 는 도 1 의 디코더 (118) 를 포함할 수도 있다.
기지국 (2600) 은 메모리 (2632) 를 포함할 수도 있다. 컴퓨터 판독가능 저장 디바이스와 같은, 메모리 (2632) 는 명령들을 포함할 수도 있다. 명령들은 프로세서 (2606), 트랜스코더 (2610), 또는 이들의 조합에 의해 실행가능한, 도 1 내지 도 25 의 방법들 및 시스템들을 참조하여 설명된 하나 이상의 동작들을 수행하는 하나 이상의 명령들을 포함할 수도 있다. 기지국 (2600) 은 안테나들의 어레이에 커플링된, 제 1 트랜시버 (2652) 및 제 2 트랜시버 (2654) 와 같은, 다수의 송신기들 및 수신기들 (예컨대, 트랜시버들) 을 포함할 수도 있다. 안테나들의 어레이는 제 1 안테나 (2642) 및 제 2 안테나 (2644) 를 포함할 수도 있다. 안테나들의 어레이는 도 25 의 디바이스 (2500) 와 같은 하나 이상의 무선 디바이스들과 무선으로 통신하도록 구성될 수도 있다. 예를 들어, 제 2 안테나 (2644) 는 무선 디바이스로부터 데이터 스트림 (2614) (예컨대, 비트 스트림) 을 수신할 수도 있다. 데이터 스트림 (2614) 은 메시지들, 데이터 (예컨대, 인코딩된 음성 데이터), 또는 이들의 조합을 포함할 수도 있다.
기지국 (2600) 은 백홀 접속부와 같은, 네트워크 접속부 (2660) 를 포함할 수도 있다. 네트워크 접속부 (2660) 는 무선 통신 네트워크의 하나 이상의 기지국들 또는 코어 네트워크와 통신하도록 구성될 수도 있다. 예를 들어, 기지국 (2600) 은 코어 네트워크로부터 네트워크 접속부 (2660) 를 통해서 제 2 데이터 스트림 (예컨대, 메시지들 또는 오디오 데이터) 을 수신할 수도 있다. 기지국 (2600) 은 제 2 데이터 스트림을 프로세싱하여 메시지들 또는 오디오 데이터를 발생시키고, 메시지들 또는 오디오 데이터를 안테나들의 어레이의 하나 이상의 안테나들을 통해서 하나 이상의 무선 디바이스에 또는 네트워크 접속부 (2660) 를 통해서 다른 기지국에 제공할 수도 있다. 특정의 구현예에서, 네트워크 접속부 (2660) 는 예시적인, 비한정적인 예로서 광역 네트워크 (WAN) 접속부일 수도 있다. 일부 구현예들에서, 코어 네트워크는 공중 교환 전화 네트워크 (PSTN), 패킷 백본 네트워크, 또는 양자를 포함하거나 또는 이들에 대응할 수도 있다.
기지국 (2600) 은 네트워크 접속부 (2660) 및 프로세서 (2606) 에 커플링된 미디어 게이트웨이 (2670) 를 포함할 수도 있다. 미디어 게이트웨이 (2670) 는 상이한 원격 통신들 기술들의 미디어 스트림들 사이에 변환하도록 구성될 수도 있다. 예를 들어, 미디어 게이트웨이 (2670) 는 상이한 송신 프로토콜들, 상이한 코딩 방식들, 또는 양자 사이를 변환할 수도 있다. 예시하기 위하여, 미디어 게이트웨이 (2670) 는 예시적인, 비한정적인 예로서, PCM 신호들로부터 실시간 전송 프로토콜 (RTP) 신호들로 변환할 수도 있다. 미디어 게이트웨이 (2670) 는 패킷 교환 네트워크들 (예컨대, VoIP (Voice over Internet Protocol) 네트워크, IP 멀티미디어 서브시스템 (IMS), 4세대 (4G) 무선 네트워크, 예컨대 LTE, WiMax, 및 UMB, 등), 회선 스위칭 네트워크들 (예컨대, PSTN), 및 하이브리드 네트워크들 (예컨대, 2세대 (2G) 무선 네트워크, 예컨대 GSM, GPRS, 및 에지, 3세대 (3G) 무선 네트워크, 예컨대 WCDMA, EV-DO, 및 HSPA, 등) 사이의 데이터를 변환할 수도 있다.
추가적으로, 미디어 게이트웨이 (2670) 는 트랜스코더 (610) 와 같은 트랜스코더를 포함할 수도 있으며, 코덱들이 호환불가능할 때 데이터를 트랜스코딩하도록 구성될 수도 있다. 예를 들어, 미디어 게이트웨이 (2670) 는 예시적인, 비한정적인 예로서, 적응적 멀티-레이트 (AMR) 코덱과 G.711 코덱 사이에 트랜스코딩할 수도 있다. 미디어 게이트웨이 (2670) 는 라우터 및 복수의 물리적인 인터페이스들을 포함할 수도 있다. 일부 구현예들에서, 미디어 게이트웨이 (2670) 는 또한 제어기 (미도시) 를 포함할 수도 있다. 특정의 구현예에서, 미디어 게이트웨이 제어기는 미디어 게이트웨이 (2670) 의 외부에 있거나, 기지국 (2600) 의 외부에 있거나, 또는 양자일 수도 있다. 미디어 게이트웨이 제어기는 다수의 미디어 게이트웨이들의 동작들을 제어하고 조정할 수도 있다. 미디어 게이트웨이 (2670) 는 미디어 게이트웨이 제어기로부터 제어 신호들을 수신할 수도 있으며, 상이한 송신 기술들 사이를 브릿지하도록 기능할 수도 있으며, 최종-사용자 능력들 및 접속들에 서비스를 추가할 수도 있다.
기지국 (2600) 은 트랜시버들 (2652, 2654), 수신기 데이터 프로세서 (2664), 및 프로세서 (2606) 에 커플링된 복조기 (2662) 를 포함할 수도 있으며, 수신기 데이터 프로세서 (2664) 는 프로세서 (2606) 에 커플링될 수도 있다. 복조기 (2662) 는 트랜시버들 (2652, 2654) 로부터 수신된 변조된 신호들을 복조하여, 복조된 데이터를 수신기 데이터 프로세서 (2664) 에 제공하도록 구성될 수도 있다. 수신기 데이터 프로세서 (2664) 는 복조된 데이터로부터 메시지 또는 오디오 데이터를 추출하여 메시지 또는 오디오 데이터를 프로세서 (2606) 로 전송하도록 구성될 수도 있다.
기지국 (2600) 은 송신 데이터 프로세서 (2682) 및 송신 다중 입력-다중 출력 (MIMO) 프로세서 (2684) 를 포함할 수도 있다. 송신 데이터 프로세서 (2682) 는 프로세서 (2606) 및 송신 MIMO 프로세서 (2684) 에 커플링될 수도 있다. 송신 MIMO 프로세서 (2684) 는 트랜시버들 (2652, 2654) 및 프로세서 (2606) 에 커플링될 수도 있다. 일부 구현예들에서, 송신 MIMO 프로세서 (2684) 는 미디어 게이트웨이 (2670) 에 커플링될 수도 있다. 송신 데이터 프로세서 (2682) 는 프로세서 (2606) 로부터 메시지들 또는 오디오 데이터를 수신하여, 예시적인, 비한정적인 예들로서, CDMA 또는 직교 주파수-분할 멀티플렉싱 (OFDM) 과 같은 코딩 방식에 기초하여 메시지들 또는 오디오 데이터를 코딩하도록 구성될 수도 있다. 송신 데이터 프로세서 (2682) 는 코딩된 데이터를 송신 MIMO 프로세서 (2684) 에 제공할 수도 있다.
코딩된 데이터는 멀티플렉싱된 데이터를 발생시키기 위해 CDMA 또는 OFDM 기법들을 이용하여 파일럿 데이터와 같은 다른 데이터와 멀티플렉싱될 수도 있다. 멀티플렉싱된 데이터는 그후 변조 심볼들을 발생시키기 위해 특정의 변조 방식 (예컨대, 2진 위상-시프트 키잉 ("BPSK"), 직교 위상-시프트 키잉 ("QSPK"), M-ary 위상-시프트 키잉 ("M-PSK"), M-ary 직교 진폭 변조 ("M-QAM"), 등) 에 기초하여 송신 데이터 프로세서 (2682) 에 의해 변조될 (즉, 심볼 맵핑될) 수도 있다. 특정의 구현예에서, 코딩된 데이터 및 다른 데이터는 상이한 변조 방식들을 이용하여 변조될 수도 있다. 각각의 데이터 스트림에 대한 데이터 레이트, 코딩, 및 변조는 프로세서 (2606) 에 의해 실행되는 명령들에 의해 결정될 수도 있다.
송신 MIMO 프로세서 (2684) 는 송신 데이터 프로세서 (2682) 로부터 변조 심볼들을 수신하도록 구성될 수도 있으며, 변조 심볼들을 추가로 프로세싱할 수도 있으며 데이터에 대해 빔포밍을 수행할 수도 있다. 예를 들어, 송신 MIMO 프로세서 (2684) 는 빔포밍 가중치들을 변조 심볼들에 적용할 수도 있다. 빔포밍 가중치들은 변조 심볼들이 송신되는 안테나들의 어레이의 하나 이상의 안테나들에 대응할 수도 있다.
동작 동안, 기지국 (2600) 의 제 2 안테나 (2644) 는 데이터 스트림 (2614) 을 수신할 수도 있다. 제 2 트랜시버 (2654) 는 제 2 안테나 (2644) 로부터 데이터 스트림 (2614) 을 수신할 수도 있으며 데이터 스트림 (2614) 을 복조기 (2662) 에 제공할 수도 있다. 복조기 (2662) 는 데이터 스트림 (2614) 의 변조된 신호들을 복조하여 복조된 데이터를 수신기 데이터 프로세서 (2664) 에 제공할 수도 있다. 수신기 데이터 프로세서 (2664) 는 복조된 데이터로부터 오디오 데이터를 추출하여, 추출된 오디오 데이터를 프로세서 (2606) 에 제공할 수도 있다.
프로세서 (2606) 는 트랜스코딩을 위해 오디오 데이터를 트랜스코더 (2610) 에 제공할 수도 있다. 트랜스코더 (2610) 의 디코더 (2638) 는 오디오 데이터를 제 1 포맷으로부터 디코딩된 오디오 데이터로 디코딩할 수도 있으며, 인코더 (2636) 는 디코딩된 오디오 데이터를 제 2 포맷으로 인코딩할 수도 있다. 일부 구현예들에서, 인코더 (2636) 는 무선 디바이스로부터 수신된 것보다 더 높은 데이터 레이트 (예컨대, 상향변환) 또는 더 낮은 데이터 레이트 (예컨대, 하향변환) 를 이용하여 오디오 데이터를 인코딩할 수도 있다. 다른 구현예들에서, 오디오 데이터는 트랜스코딩되지 않을 수도 있다. 트랜스코딩 (예컨대, 디코딩 및 인코딩) 이 트랜스코더 (2610) 에 의해 수행되는 것으로 예시되지만, 트랜스코딩 동작들 (예컨대, 디코딩 및 인코딩) 은 기지국 (2600) 의 다수의 컴포넌트들에 의해 수행될 수도 있다. 예를 들어, 디코딩은 수신기 데이터 프로세서 (2664) 에 의해 수행될 수도 있으며, 인코딩은 송신 데이터 프로세서 (2682) 에 의해 수행될 수도 있다. 일부 구현예들에서, 프로세서 (2606) 는 다른 송신 프로토콜, 코딩 방식, 또는 양자로의 변환을 위해 오디오 데이터를 미디어 게이트웨이 (2670) 에 제공할 수도 있다. 미디어 게이트웨이 (2670) 는 변환된 데이터를 네트워크 접속부 (2660) 를 통해서 다른 기지국 또는 코어 네트워크에 제공할 수도 있다.
인코더 (2636) 는 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 사이의 시간 지연을 표시하는 최종 시프트 값 (116) 을 결정할 수도 있다. 인코더 (2636) 는 최종 시프트 값 (116) 에 기초하여 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 를 인코딩함으로써, 인코딩된 신호들 (102), 이득 파라미터 (160), 또는 양자를 발생시킬 수도 있다. 인코더 (2636) 는 최종 시프트 값 (116) 에 기초하여 참조 신호 표시자 (164) 및 비-인과적 시프트 값 (162) 을 발생시킬 수도 있다. 디코더 (118) 는 참조 신호 표시자 (164), 비-인과적 시프트 값 (162), 이득 파라미터 (160), 또는 이들의 조합에 기초하여, 인코딩된 신호들을 디코딩함으로써 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 를 발생시킬 수도 있다. 트랜스코딩된 데이터와 같은, 인코더 (2636) 에서 발생된 인코딩된 오디오 데이터는 프로세서 (2606) 를 경유하여 송신 데이터 프로세서 (2682) 또는 네트워크 접속부 (2660) 에 제공될 수도 있다.
트랜스코더 (2610) 로부터의 트랜스코딩된 오디오 데이터는 OFDM 과 같은, 변조 방식에 따라서 코딩하여 변조 심볼들을 발생시키기 위해 송신 데이터 프로세서 (2682) 에 제공될 수도 있다. 송신 데이터 프로세서 (2682) 는 추가적인 프로세싱 및 빔포밍을 위해 변조 심볼들을 송신 MIMO 프로세서 (2684) 에 제공할 수도 있다. 송신 MIMO 프로세서 (2684) 는 빔포밍 가중치들을 적용할 수도 있으며, 변조 심볼들을 제 1 트랜시버 (2652) 를 통해서 제 1 안테나 (2642) 와 같은, 안테나들의 어레이의 하나 이상의 안테나들에 제공할 수도 있다. 따라서, 기지국 (2600) 은 무선 디바이스로부터 수신된 데이터 스트림 (2614) 에 대응하는 트랜스코딩된 데이터 스트림 (2616) 을 다른 무선 디바이스에 제공할 수도 있다. 트랜스코딩된 데이터 스트림 (2616) 은 데이터 스트림 (2614) 과는 상이한 인코딩 포맷, 데이터 레이트, 또는 양쪽을 가질 수도 있다. 다른 구현예들에서, 트랜스코딩된 데이터 스트림 (2616) 은 다른 기지국 또는 코어 네트워크로의 송신을 위해 네트워크 접속부 (2660) 에 제공될 수도 있다.
기지국 (2600) 은 따라서, 프로세서 (예컨대, 프로세서 (2606) 또는 트랜스코더 (2610)) 에 의해 실행될 때, 프로세서로 하여금, 제 1 오디오 신호와 제 2 오디오 신호 사이의 시간 지연의 양을 표시하는 시프트 값을 결정하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터 판독가능 저장 디바이스 (예컨대, 메모리 (2632)) 를 포함할 수도 있다. 제 1 오디오 신호는 제 1 마이크로폰을 통해서 수신되고, 제 2 오디오 신호는 제 2 마이크로폰을 통해서 수신된다. 동작들은 또한 시프트 값에 기초하여 제 2 오디오 신호를 시프트시킴으로써 시간-시프트된 제 2 오디오 신호를 발생시키는 것을 포함한다. 동작들은 제 1 오디오 신호의 제 1 샘플들 및 시간-시프트된 제 2 오디오 신호의 제 2 샘플들에 기초하여 적어도 하나의 인코딩된 신호를 발생시키는 것을 더 포함한다. 동작들은 또한 적어도 하나의 인코딩된 신호를 디바이스로 전송하는 것을 포함한다.
당업자들은 또한 본원에서 개시한 양태들과 관련하여 설명된 다양한 예시적인 로직 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 하드웨어 프로세서와 같은 프로세싱 디바이스에 의해 실행되는 컴퓨터 소프트웨어, 또는 양자의 조합들로서 구현될 수도 있음을 알 수 있을 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들, 및 단계들이 일반적으로 그들의 기능의 관점에서 위에서 설명되었다. 이러한 기능이 하드웨어 또는 실행가능한 소프트웨어로서 구현되는지 여부는 특정의 애플리케이션 및 전체 시스템에 가해지는 설계 제약들에 의존한다. 당업자들은 각각의 특정의 애플리케이션 마다 설명한 기능을 다양한 방법으로 구현할 수도 있으며, 그러나 이런 구현 결정들은 본 개시물의 범위로부터의 일탈을 초래하는 것으로 해석되어서는 안된다.
본원에서 개시한 양태들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 직접 하드웨어로, 프로세서에 의해 실행되는 소프트웨어 모듈로, 또는 이 둘의 조합으로 구현될 수도 있다. 소프트웨어 모듈은 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 전송 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈식 디스크, 또는 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은, 메모리 디바이스에 상주할 수도 있다. 예시적인 메모리 디바이스는 프로세서가 메모리 디바이스로부터 정보를 판독하고 그에 정보를 기록할 수 있도록 프로세서에 커플링된다. 대안적으로는, 메모리 디바이스는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 주문형 집적 회로 (ASIC) 에 상주할 수도 있다. ASIC 는 컴퓨팅 디바이스 및 사용자 단말기에 상주할 수도 있다. 대안적으로는, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에서 별개의 컴포넌트들로서 상주할 수도 있다.
개시된 양태들의 이전 설명은 당업자로 하여금 개시된 양태들을 실시하거나 또는 이용할 수 있도록 하기 위해서 제공된다. 이들 양태들에 대한 여러 변경들은 당업자들에게 명백할 것이며, 본원에서 정의된 원리들은 본 개시물의 범위로부터 일탈함이 없이 다른 양태들에 적용될 수도 있다. 따라서, 본 개시물은 본원에서 나타낸 양태들에 한정하려는 것이 아니라, 다음 청구항들에 의해 정의되는 바와 같은 원리들 및 신규한 특징들과 가능한 부합하는 최광의의 범위를 부여하려는 것이다.

Claims (30)

  1. 디바이스로서,
    인코더를 포함하고, 상기 인코더는,
    2개 이상의 채널들을 수신하고;
    목표 채널 및 참조 채널을 식별하는 것으로서, 상기 목표 채널 및 상기 참조 채널은 부정합 값에 기초하여 상기 2개 이상의 채널들로부터 식별된, 상기 목표 채널 및 참조 채널을 식별하고;
    상기 부정합 값에 기초하여 상기 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 것으로서, 상기 부정합 값은 상기 목표 채널과 상기 참조 채널 사이의 시간 부정합의 양을 표시하는, 상기 수정된 목표 채널을 발생시키고;
    상기 참조 채널과 연관된 제 1 신호와 상기 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하고;
    상기 시간 상관 값을 임계치와 비교하고; 그리고
    상기 비교에 기초하여, 상기 참조 채널에 기초한 참조 프레임 또는 상기 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 것으로서, 상기 제 1 신호는 상기 참조 프레임의 부분에 대응하고, 상기 제 2 신호는 상기 목표 프레임의 부분에 대응하는, 상기 손실된 목표 샘플들을 발생시키도록 구성된, 디바이스.
  2. 제 1 항에 있어서,
    상기 참조 프레임은 상기 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 상기 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함하며, 상기 목표 프레임은 상기 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함하는, 디바이스.
  3. 제 1 항에 있어서,
    상기 인코더는 상기 시간 상관 값이 상기 임계치를 만족시킨다고 결정하도록 추가로 구성되며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시킨다는 상기 결정에 응답하여 상기 참조 채널에 기초하여 발생되는, 디바이스.
  4. 제 1 항에 있어서,
    상기 인코더는 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하도록 추가로 구성되며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여, 선형 예측 필터를 이용하여 상기 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생되는, 디바이스.
  5. 제 1 항에 있어서,
    상기 인코더는 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하도록 추가로 구성되며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여 상기 수정된 목표 채널을 제로로 스케일링함으로써 발생되는, 디바이스.
  6. 제 1 항에 있어서,
    상기 인코더는 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하도록 추가로 구성되며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여 상기 수정된 목표 채널로부터 외삽되는, 디바이스.
  7. 제 1 항에 있어서,
    상기 손실된 목표 샘플들은, 상기 참조 채널에 부분적으로 기초하여 그리고 선형 예측 필터를 이용하여 상기 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 부분적으로 기초하여 발생되는, 디바이스.
  8. 제 1 항에 있어서,
    상기 손실된 목표 샘플들은, 상기 참조 채널에 부분적으로 기초하여 그리고 상기 수정된 목표 채널을 제로로 스케일링하는 것에 부분적으로 기초하여 발생되는, 디바이스.
  9. 제 1 항에 있어서,
    상기 손실된 목표 샘플들은, 상기 참조 채널에 부분적으로 기초하여 그리고 상기 수정된 목표 채널로부터의 외삽들에 부분적으로 기초하여 발생되는, 디바이스.
  10. 제 1 항에 있어서,
    상기 목표 채널의 조정은 비-인과적 시프트에 기초하는, 디바이스.
  11. 제 1 항에 있어서,
    상기 손실된 목표 샘플들은 코더 유형에 추가로 기초하는, 디바이스.
  12. 제 1 항에 있어서,
    상기 참조 프레임은 상기 참조 채널의 여기에 기초하며, 상기 목표 프레임은 상기 수정된 목표 채널의 여기에 기초하는, 디바이스.
  13. 제 1 항에 있어서,
    상기 인코더는 모바일 디바이스에 통합되는, 디바이스.
  14. 제 1 항에 있어서,
    상기 인코더는 기지국에 통합되는, 디바이스.
  15. 오디오 채널들을 인코딩하는 방법으로서,
    인코더에서 2개 이상의 채널들을 수신하는 단계;
    목표 채널 및 참조 채널을 식별하는 단계로서, 상기 목표 채널 및 상기 참조 채널은 부정합 값에 기초하여 상기 2개 이상의 채널들로부터 식별된, 상기 목표 채널 및 참조 채널을 식별하는 단계;
    상기 부정합 값에 기초하여 상기 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 단계로서, 상기 부정합 값은 상기 목표 채널과 상기 참조 채널 사이의 시간 부정합의 양을 표시하는, 상기 수정된 목표 채널을 발생시키는 단계;
    상기 참조 채널과 연관된 제 1 신호와 상기 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 단계;
    상기 시간 상관 값을 임계치과 비교하는 단계; 및
    상기 비교에 기초하여, 상기 참조 채널에 기초한 참조 프레임 또는 상기 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 단계로서, 상기 제 1 신호는 상기 참조 프레임의 부분에 대응하고, 상기 제 2 신호는 상기 목표 프레임의 부분에 대응하는, 상기 손실된 목표 샘플들을 발생시키는 단계를 포함하는, 오디오 채널들을 인코딩하는 방법.
  16. 제 15 항에 있어서,
    상기 참조 프레임은 상기 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 상기 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함하며, 상기 목표 프레임은 상기 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함하는, 오디오 채널들을 인코딩하는 방법.
  17. 제 15 항에 있어서,
    상기 시간 상관 값이 상기 임계치를 만족시킨다고 결정하는 단계를 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시킨다는 상기 결정에 응답하여 상기 참조 채널에 기초하여 발생되는, 오디오 채널들을 인코딩하는 방법.
  18. 제 15 항에 있어서,
    상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하는 단계를 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여, 선형 예측 필터를 이용하여 상기 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생되는, 오디오 채널들을 인코딩하는 방법.
  19. 제 15 항에 있어서,
    상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하는 단계를 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여 상기 수정된 목표 채널을 제로로 스케일링함으로써 발생되는, 오디오 채널들을 인코딩하는 방법.
  20. 제 15 항에 있어서,
    상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하는 단계를 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여 상기 수정된 목표 채널로부터 외삽되는, 오디오 채널들을 인코딩하는 방법.
  21. 제 15 항에 있어서,
    상기 손실된 목표 샘플들은, 상기 참조 채널에 부분적으로 기초하여 그리고 선형 예측 필터를 이용하여 상기 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 부분적으로 기초하여 발생되는, 오디오 채널들을 인코딩하는 방법.
  22. 제 15 항에 있어서,
    상기 손실된 목표 샘플들을 발생시키는 단계는 모바일 디바이스에서 수행되는, 오디오 채널들을 인코딩하는 방법.
  23. 제 15 항에 있어서,
    상기 손실된 목표 샘플들을 발생시키는 단계는 기지국에서 수행되는, 오디오 채널들을 인코딩하는 방법.
  24. 명령들을 포함하는 비일시적 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은, 인코더 내 프로세서에 의해 실행될 때, 상기 프로세서로 하여금,
    목표 채널 및 참조 채널을 식별하는 것으로서, 상기 목표 채널 및 상기 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된, 상기 목표 채널 및 참조 채널을 식별하는 것;
    상기 부정합 값에 기초하여 상기 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 것으로서, 상기 부정합 값은 상기 목표 채널과 상기 참조 채널 사이의 시간 부정합의 양을 표시하는, 상기 수정된 목표 채널을 발생시키는 것;
    상기 참조 채널과 연관된 제 1 신호와 상기 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 것;
    상기 시간 상관 값을 임계치과 비교하는 것; 및
    상기 비교에 기초하여, 상기 참조 채널에 기초한 참조 프레임 또는 상기 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 것으로서, 상기 제 1 신호는 상기 참조 프레임의 부분에 대응하고, 상기 제 2 신호는 상기 목표 프레임의 부분에 대응하는, 상기 손실된 목표 샘플들을 발생시키는 것을 포함하는 동작들을 수행하게 하는, 비일시적 컴퓨터 판독가능 저장 매체.
  25. 제 24 항에 있어서,
    상기 참조 프레임은 상기 참조 프레임의 제 1 부분과 연관된 제 1 참조 샘플들 및 상기 참조 프레임의 제 2 부분과 연관된 제 2 참조 샘플들을 포함하며, 상기 목표 프레임은 상기 목표 프레임의 제 1 부분과 연관된 제 1 목표 샘플들을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
  26. 제 24 항에 있어서,
    상기 동작들은 상기 시간 상관 값이 상기 임계치를 만족시킨다고 결정하는 것을 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시킨다는 상기 결정에 응답하여 상기 참조 채널에 기초하여 발생되는, 비일시적 컴퓨터 판독가능 저장 매체.
  27. 제 24 항에 있어서,
    상기 동작들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다고 결정하는 것을 더 포함하며, 상기 손실된 목표 샘플들은 상기 시간 상관 값이 상기 임계치를 만족시키지 못한다는 상기 결정에 응답하여, 선형 예측 필터를 이용하여 상기 수정된 목표 채널의 샘플들의 과거 세트로부터 필터링된 무작위 잡음에 기초하여 발생되는, 비일시적 컴퓨터 판독가능 저장 매체.
  28. 장치로서,
    목표 채널 및 참조 채널을 식별하는 수단으로서, 상기 목표 채널 및 상기 참조 채널은 부정합 값에 기초하여 2개 이상의 채널들로부터 식별된, 상기 목표 채널 및 참조 채널을 식별하는 수단;
    상기 부정합 값에 기초하여 상기 목표 채널을 시간적으로 조정함으로써 수정된 목표 채널을 발생시키는 수단으로서, 상기 부정합 값은 상기 목표 채널과 상기 참조 채널 사이의 시간 부정합의 양을 표시하는, 상기 수정된 목표 채널을 발생시키는 수단;
    상기 참조 채널과 연관된 제 1 신호와 상기 수정된 목표 채널과 연관된 제 2 신호 사이의 시간 상관을 표시하는 시간 상관 값을 결정하는 수단;
    상기 시간 상관 값을 임계치과 비교하는 수단; 및
    상기 비교에 기초하여, 상기 참조 채널에 기초한 참조 프레임 또는 상기 수정된 목표 채널에 기초한 목표 프레임 중 적어도 하나를 이용하여 손실된 목표 샘플들을 발생시키는 수단으로서, 상기 제 1 신호는 상기 참조 프레임의 부분에 대응하고, 상기 제 2 신호는 상기 목표 프레임의 부분에 대응하는, 상기 손실된 목표 샘플들을 발생시키는 수단을 포함하는, 장치.
  29. 제 28 항에 있어서,
    상기 손실된 목표 샘플들을 발생시키는 수단은 모바일 디바이스에 통합되는, 장치.
  30. 제 28 항에 있어서,
    상기 손실된 목표 샘플들을 발생시키는 수단은 기지국에 통합되는, 장치.
KR1020197030037A 2017-03-20 2018-02-09 목표 샘플 발생 KR102551431B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762474010P 2017-03-20 2017-03-20
US62/474,010 2017-03-20
US15/892,130 US10304468B2 (en) 2017-03-20 2018-02-08 Target sample generation
US15/892,130 2018-02-08
PCT/US2018/017654 WO2018175012A1 (en) 2017-03-20 2018-02-09 Target sample generation

Publications (2)

Publication Number Publication Date
KR20190129084A true KR20190129084A (ko) 2019-11-19
KR102551431B1 KR102551431B1 (ko) 2023-07-04

Family

ID=63520155

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197030037A KR102551431B1 (ko) 2017-03-20 2018-02-09 목표 샘플 발생

Country Status (9)

Country Link
US (2) US10304468B2 (ko)
EP (1) EP3602547B1 (ko)
KR (1) KR102551431B1 (ko)
CN (1) CN110462732A (ko)
AU (1) AU2018237285B2 (ko)
BR (1) BR112019019144A2 (ko)
SG (1) SG11201907116UA (ko)
TW (1) TWI781140B (ko)
WO (1) WO2018175012A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230052238A (ko) 2021-10-12 2023-04-19 이리소 일렉트로닉스 컴패니 리미티드 커넥터 세트
KR20230052239A (ko) 2021-10-12 2023-04-19 이리소 일렉트로닉스 컴패니 리미티드 커넥터

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10891960B2 (en) 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
US10932122B1 (en) * 2019-06-07 2021-02-23 Sprint Communications Company L.P. User equipment beam effectiveness
CN111199743B (zh) * 2020-02-28 2023-08-18 Oppo广东移动通信有限公司 音频编码格式确定方法、装置、存储介质及电子设备
CN112037825B (zh) * 2020-08-10 2022-09-27 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
KR102421027B1 (ko) * 2020-08-28 2022-07-15 국방과학연구소 화자 음성 분석 장치, 방법, 컴퓨터 판독 가능한 기록매체 및 컴퓨터 프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
WO2011109374A1 (en) * 2010-03-05 2011-09-09 Motorola Mobility, Inc. Decoder for audio signal including generic audio and speech frames

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5136578A (en) * 1990-09-21 1992-08-04 Northern Telecom Limited Transposed multi-channel switching
US6785261B1 (en) * 1999-05-28 2004-08-31 3Com Corporation Method and system for forward error correction with different frame sizes
US20050007452A1 (en) * 2001-09-07 2005-01-13 Mckay Therman Ward Video analyzer
US7020203B1 (en) * 2001-12-21 2006-03-28 Polycom, Inc. Dynamic intra-coded macroblock refresh interval for video error concealment
WO2003081577A1 (en) * 2002-03-22 2003-10-02 British Telecommunications Public Limited Company Anomaly recognition method for data streams
EP1537746A2 (en) * 2002-09-06 2005-06-08 Koninklijke Philips Electronics N.V. Content-adaptive multiple description motion compensation for improved efficiency and error resilience
US7032166B2 (en) * 2002-12-03 2006-04-18 Massachusetts Institute Of Technology Method and apparatus for protecting data
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
US7852950B2 (en) * 2005-02-25 2010-12-14 Broadcom Corporation Methods and apparatuses for canceling correlated noise in a multi-carrier communication system
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US7370261B2 (en) * 2005-05-09 2008-05-06 International Business Machines Corporation Convolution-encoded raid with trellis-decode-rebuild
BRPI0613522B1 (pt) * 2005-07-25 2019-09-17 Interdigital Madison Patent Holdings Método e aparelho para a detecção e ocultamento de quadros de vídeo de referência e de não-referência
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
US8902996B2 (en) * 2008-02-26 2014-12-02 Richwave Technology Corp. Adaptive wireless video transmission systems and methods
US20100158130A1 (en) * 2008-12-22 2010-06-24 Mediatek Inc. Video decoding method
WO2010137300A1 (ja) * 2009-05-26 2010-12-02 パナソニック株式会社 復号装置及び復号方法
ES2524428T3 (es) * 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
TWI431611B (zh) * 2009-10-20 2014-03-21 Dolby Int Ab 用以基於下混信號表示型態提供上混信號表示型態之裝置、用以提供表示多聲道音訊信號的位元串流之裝置、使用失真控制發訊之方法、電腦程式與位元串流
CN102656627B (zh) * 2009-12-16 2014-04-30 诺基亚公司 多信道音频处理方法和装置
US20120314776A1 (en) * 2010-02-24 2012-12-13 Nippon Telegraph And Telephone Corporation Multiview video encoding method, multiview video decoding method, multiview video encoding apparatus, multiview video decoding apparatus, and program
EP2671222B1 (en) 2011-02-02 2016-03-02 Telefonaktiebolaget LM Ericsson (publ) Determining the inter-channel time difference of a multi-channel audio signal
US9311923B2 (en) * 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
EP2702588B1 (en) * 2012-04-05 2015-11-18 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
WO2013149672A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
CA2870067C (en) * 2012-04-16 2017-01-17 Nokia Corporation Video coding and decoding using multiple parameter sets which are identified in video unit headers
US20150341667A1 (en) * 2012-12-21 2015-11-26 Thomson Licensing Video quality model, method for training a video quality model, and method for determining video quality using a video quality model
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9767802B2 (en) * 2013-08-29 2017-09-19 Vonage Business Inc. Methods and apparatus for conducting internet protocol telephony communications
GB2515362B (en) * 2013-12-16 2015-12-09 Imagination Tech Ltd Decoding frames
US20160372127A1 (en) * 2015-06-22 2016-12-22 Qualcomm Incorporated Random noise seed value generation
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
US10045145B2 (en) * 2015-12-18 2018-08-07 Qualcomm Incorporated Temporal offset estimation
US10115403B2 (en) * 2015-12-18 2018-10-30 Qualcomm Incorporated Encoding of multiple audio signals
US10074373B2 (en) * 2015-12-21 2018-09-11 Qualcomm Incorporated Channel adjustment for inter-frame temporal shift variations
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
US11445223B2 (en) * 2016-09-09 2022-09-13 Microsoft Technology Licensing, Llc Loss detection for encoded video transmission
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
US10366695B2 (en) * 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
WO2011109374A1 (en) * 2010-03-05 2011-09-09 Motorola Mobility, Inc. Decoder for audio signal including generic audio and speech frames

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230052238A (ko) 2021-10-12 2023-04-19 이리소 일렉트로닉스 컴패니 리미티드 커넥터 세트
KR20230052239A (ko) 2021-10-12 2023-04-19 이리소 일렉트로닉스 컴패니 리미티드 커넥터

Also Published As

Publication number Publication date
BR112019019144A2 (pt) 2020-04-14
US10714101B2 (en) 2020-07-14
EP3602547A1 (en) 2020-02-05
US20180268828A1 (en) 2018-09-20
CN110462732A (zh) 2019-11-15
SG11201907116UA (en) 2019-10-30
WO2018175012A1 (en) 2018-09-27
AU2018237285A1 (en) 2019-08-22
TWI781140B (zh) 2022-10-21
TW201835898A (zh) 2018-10-01
US10304468B2 (en) 2019-05-28
KR102551431B1 (ko) 2023-07-04
US20190259392A1 (en) 2019-08-22
EP3602547C0 (en) 2023-08-30
EP3602547B1 (en) 2023-08-30
AU2018237285B2 (en) 2022-11-10

Similar Documents

Publication Publication Date Title
US11094330B2 (en) Encoding of multiple audio signals
KR102551431B1 (ko) 목표 샘플 발생
KR102032668B1 (ko) 다수의 오디오 신호들의 인코딩
EP3391371B1 (en) Temporal offset estimation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant