KR20070061872A - 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형 - Google Patents

바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형 Download PDF

Info

Publication number
KR20070061872A
KR20070061872A KR1020077008410A KR20077008410A KR20070061872A KR 20070061872 A KR20070061872 A KR 20070061872A KR 1020077008410 A KR1020077008410 A KR 1020077008410A KR 20077008410 A KR20077008410 A KR 20077008410A KR 20070061872 A KR20070061872 A KR 20070061872A
Authority
KR
South Korea
Prior art keywords
envelope
channels
audio
channel
cue
Prior art date
Application number
KR1020077008410A
Other languages
English (en)
Other versions
KR100924576B1 (ko
Inventor
에릭 알라망쉬
사샤 디치
크리스토프 팔러
쥐르겐 헤르
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
에이저 시스템즈 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우., 에이저 시스템즈 인크 filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20070061872A publication Critical patent/KR20070061872A/ko
Application granted granted Critical
Publication of KR100924576B1 publication Critical patent/KR100924576B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Superheterodyne Receivers (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Outer Garments And Coats (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Steroid Compounds (AREA)

Abstract

오디오 인코더 측에서, 하나 또는 그 이상의 오디오 채널에 대해 큐 코드가 생성되고, 오디오 채널의 시간 엔벌로프를 특징 지움에 의해 엔벌로프 큐 코드가 생성된다. 오디오 디코더 측에서, 전송된 오디오 채널(들)이 디코딩되어 C개의 재생 오디오 채널을 생성한다. 여기서 C
Figure 112007028275678-PCT00078
E 여기서 C
Figure 112007028275678-PCT00079
E
Figure 112007028275678-PCT00080
1이다. 수신된 큐 코드는 전송된 채널(들)에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함한다. 하나 또는 그 이상의 채널(들)이 업믹싱되어 하나 또는 그 이상의 업믹싱된 채널을 생성한다. 하나 또는 그 이상의 재생 채널들이 큐 코드를 하나 또는 그 이상의 업믹싱된 채널들에 가함으로써 합성된다. 여기서 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프와 실질적으로 정합되게 한다.
오디오 인코더, 디코더, 시간 엔벌로프, 큐 코드, 채널 정형, 업믹싱

Description

바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프 정형{Individual channel temporal envelope shaping for binaural cue coding schemes and the like}
본 발명은 오디오신호의 인코딩 방법 및 그 인코딩된 오디오 데이터로부터 청각적 장면을 합성하는 방법에 관한 것이다.
관련 출원의 상호 참조
본 출원은 2004. 10. 20.자 미합중국 가특허출원 제 60/620,480호 (대리인 명부 번호 Allamanche 2-3-18-4)에 대해 우선권 주장이 있으며, 이 출원의 개시 내용은 본 명세서에 참고로 통합되었다.
부가적으로, 본 출원의 주제는 이하의 미합중국 특허출원의 주제와 관련이 있으며, 그 개시 내용 또한 본 명세서에 참고로 혼합되어 있다:
o 2001. 5. 4.자 미합중국 특허출원 제 09/848,877호 (대리인 명부 번호 Faller 5),
o 2001. 11. 7.자 미합중국 특허출원 제 09/848,877호 (대리인 명부 번 호 Baumgarte 1-6-8); 2001. 8. 10.자 미합중국 가특허출원 제 60/311,565호에 대해 우선권 주장을 함,
o 2002. 5. 24.자 미합중국 특허출원 제 10/155,437호 (대리인 명부 번호 Baumgarte 2-10),
o 2002. 9. 18.자 미합중국 특허출원 제 10/246,570호 (대리인 명부 번호 Baumgarte 3-11),
o 2004. 4. 1.자 미합중국 특허출원 제 10/815,591호 (대리인 명부 번호 Baumgarte 7-12),
o 2004. 9. 8.자 미합중국 특허출원 제 10/936,464호 (대리인 명부 번호 Baumgarte 8-7-15),
o 2004. 1. 20.자 미합중국 특허출원 제 10/762,100호 (대리인 명부 번호 Faller 13-1), 및
o 본 출원과 동일자 미합중국 특허출원 제 10/xxx,xxx호 (대리인 명부 번호 Allamanche 1-2-17-3).
본 출원의 주제는 또한 다음의 논문에 기술된 주제와 관련이 있고 그 개시된 내용은 본 명세서에 참고로 병합되었다:
o F. Baumgarte and C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic fundamentals and design principles," IEEE Trans . on Speech and Audio Proc ., vol. 11, no. 6, Nov. 2003;
o C. Faller and F. Baumgarte, "Binaural Cue Coding - Part II: Schemes and applications," IEEE Trans . on Speech and Audio Proc ., vol. 11, no. 6, Nov. 2003; 및
o C. Faller, "Coding of spatial audio compatible with different playback formats," Preprint 117 th Conv . Aud . Eng . Soc ., October 2004.
관련 기술의 설명
사람이 특정한 음원에서 발생한 오디오 신호(즉, 소리)를 듣게 될 때, 그 오디오 신호는 사람의 좌측 및 우측 귀에 둘의 서로 다른 때에 그리고 둘의 서로 다른 오디오 레벨(예를 들어, 데시벨)을 가지고 도달한다. 이들 서로 다른 시간 및 레벨은 각각 오디오 신호가 좌측 및 우측 귀로 도달하기 위한 이동 경로의 차이에 대한 함수이다. 사람의 뇌는 이 시간과 레벨의 차이를 해석하여 수신된 오디오 신호가 사람에 대한 특정한 위치(예를 들어, 방향 및 거리)에 있는 음원에 의해 발생되고 있다는 것을 지각하게 한다. '청각적 장면'은 결국 사람에 대해 하나 또는 그 이상의 위치에 놓인 하나 또는 그 이상의 서로 다른 음원에서 발생한 오디오 신호를 사람이 동시에 듣는 효과를 의미한다.
사람의 뇌에서 행하는 위와 같은 처리는 청각적 장면을 합성하는데 사용될 수 있다. 즉, 하나 또는 그 이상의 서로 다른 음원에서 발생한 오디오신호를 의도적으로 수정하여 좌측 및 우측 오디오신호를 생성하고, 이에 의해 서로 다른 음원이 청취자에 대해 서로 다른 위치에 놓인 것으로 지각하게 하는 것이다.
도 1은 종래의 바이노럴 신호 합성기(100)의 블록 다이어그램을 나타낸다. 이 합성기(100)는 단일 음원 신호(예를 들어, 모노 신호)를 바이노럴 신호의 좌측 및 우측 오디오신호로 변환한다. 여기서, 바이노럴 신호는 청취자의 고막에서 수신된 2개 신호로서 정의된다. 음원 신호에 부가하여, 합성기(100)는 일단의 공간 큐 신호를 수신한다. 공간 큐(cue)는 청취자에 대한 음원의 희망 위치를 지시한다. 통상적인 실시에서, 일단의 공간 큐는 채널간 레벨 차(ICLD) 값(좌측 및 우측 귀 각각에서 수신한 것과 같은 좌측 및 우측 오디오 신호 간의 오디오 레벨 차이를 식별)과 채널간 시간 차(ICTD) 값(좌측 및 우측 귀 각각에 수신되는 좌측 및 우측 오디오 신호의 도달 시간 차를 식별)을 포함한다. 부가적으로 또는 대안적으로, 합성기는 헤드 관련 전달 함수(HRTF)라고 칭하는, 음원으로부터 고막까지의 오디오신호에 대한 방향종속 전달 함수를 모형화하는 합성 기술을 사용할 수 있다. 헤드 관련 전달 함수(HRTF)는 예를 들어 논문, J. Blauert, "The Psychophysics of Human Sound Localization", MIT Press, 1983 을 참고할 수 있으며 그 개시 내용은 여기에 참고로 통합되어 있다.
도 1의 바이노럴 신호 합성기(100)에서, 단일 음원에서 발생한 모노 오디오신호는 헤드폰으로 청취할 경우 적절한 공간 큐 세트(예를 들어, ICLD, ICTD 및/또는 HRTF)를 가함에 의해 음원이 공간적으로 배치되게 하고 이에 따라 각 귀에 대한 오디오신호를 발생하는 방식으로 처리될 수 있다. 이에 대해서는 예를 들어 논문, D.R. Begault, "3-D Sound for Virtual Reality and Multimedia", Academic Press, Cambridge, MA, 1994,를 참고할 수 있다.
도 1의 바이노럴 신호 합성기(100)는 단일의 음원이 청취자에 대해 놓이는 가장 단순한 형태의 청각적 장면을 연출한다. 청취자에 대해 서로 다른 위치로 놓이는 둘 또는 그 이상의 음원을 포함하는 더 복잡한 청각적 장면은 청각 장면 합성기를 사용하여 생성될 수 있다. 청각 장면 합성기는 기본적으로 여러 단계의 바이노럴 신호 합성기를 사용하여 실시되고, 각각의 바이노럴 신호 합성기는 서로 다른 음원에 대응하는 바이노럴 신호를 생성한다. 각각의 서로 다른 음원이 청취자에 대해 서로 다른 위치를 가지기 때문에, 서로 다른 음원 각각에 대한 바이노럴 오디오신호를 발생하기 위해서 서로 다른 공간 큐 세트가 사용된다.
하나의 실시예에 따르면, 본 발명은 오디오 채널을 부호화하는 방법, 장치, 및 기계 판독가능한 매체에 관련한다. 하나 또는 그 이상의 큐 코드가 하나 또는 그 이상의 오디오 채널에 대해 발생 및 전송되며, 여기서 적어도 하나의 큐 코드는 하나 또는 그 이상의 오디오 채널 중 어느 하나에서 시간 엔벌로프를 특징 지우는 것에 의해 발생한 엔벌로프 큐 코드로 된다.
다른 실시예에 따르면, 본 발명은 C개 입력 오디오 채널을 인코딩하여 E개의 전송 오디오 채널(들)을 생성하기 위한 장치이다. 이 장치는 엔벌로프 분석기, 코드 추정기, 그리고 다운믹서를 포함한다. 엔벌로프 분석기는 적어도 하나의 C개 입력 채널의 입력 시간 엔벌로프를 특징 지운다. 코드 추정기는 2개 또는 그 이상의 C개 입력 채널에 대한 큐 코드를 생성한다. 다운믹서는 C개 입력 채널을 다운믹싱하여 E개의 전송 채널을 생성한다(여기서 C
Figure 112007028275678-PCT00001
E
Figure 112007028275678-PCT00002
1). 이 장치는 디코더가 E개의 전송 채널을 디코딩할 때 합성 및 엔벌로프 정형을 수행할 수 있도록 큐 코드 및 특징 지워진 입력 시간 엔벌로프에 관한 정보를 전송한다.
다른 실시예에 따르면, 본 발명은 오디오 채널을 인코딩하여 생성된 인코딩된 오디오 비트스트림으로서, 하나 또는 그 이상의 오디오 채널에 대해 하나 또는 그 이상의 큐 코드가 생성되고, 그 적어도 하나의 큐 코드는 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드이다. 상기 하나 또는 그 이상의 큐 코드 및 하나 또는 그 이상의 오디오 채널에 대응하는 E개의 전송 오디오 채널(들)은 인코딩된 오디오 비트스트림으로 인코딩 된다(여기서, E
Figure 112007028275678-PCT00003
1).
다른 실시예에 따르면, 본 발명은 하나 또는 그 이상의 큐 코드와 E개의 전송 오디오 채널(들)을 포함하는 인코딩된 오디오 비트스트림이다. 하나 또는 그 이상의 큐 코드가 하나 또는 그 이상의 오디오 채널에 대해 생성되고, 그 적어도 하나의 큐 코드는 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드로 된다. E개의 전송 오디오 채널(들)은 하나 또는 그 이상의 오디오 채널에 해당한다.
다른 실시예에 따르면, 본 발명은 E개의 전송 오디오 채널(들)을 디코딩하여 C개의 재생 오디오 채널을 생성하기 위한 방법, 장치, 및 기계판독 가능한 매체이다(여기서 C
Figure 112007028275678-PCT00004
E
Figure 112007028275678-PCT00005
1). E개의 전송 오디오 채널(들)에 대응하는 큐 코드가 수신되고, 이 큐 코드는 E개의 전송 오디오 채널(들)에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함한다. 하나 또는 그 이상의 E 전송 채널(들)은 업믹싱되어 하나 또는 그 이상의 업믹싱된 채널을 생성한다. 하나 또는 그 이상의 C 재생 채널은, 하나 또는 그 이상의 업믹싱된 채널에 큐 코드를 가함에 의해 합성된다. 여기서, 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프에 실질적으로 정합되게 하고 있다.
본 발명의 다른 양상, 특징, 이점들은 이하의 상세한 설명과 청구범위 그리고 동일한 도면의 참조 부호가 동일 또는 유사한 요소를 밝히는 첨부 도면으로부터 더욱 충분히 알 수 있게 된다.
도 1은 종래의 바이노럴 신호 합성기의 고차적 블록 다이어그램.
도 2는 일반적인 바이노럴 큐 코딩(BCC) 오디오 처리 시스템의 블록 다이어그램.
도 3은 도 2의 다운믹서로서 사용될 수 있는 다운믹서의 블록 다이어그램.
도 4는 도 2의 디코더로서 사용될 수 있는 BCC 합성기의 블록 다이어그램.
도 5는 본 발명의 하나의 실시예에 따른 도 2의 BCC 추정기에 대한 블록 다이어그램.
도 6은 5채널 오디오에 대한 ICTD 및 ICLD 데이터의 발생 원리를 나타내는 개념도.
도 7은 5채널 오디오에 대한 ICC 데이터의 발생 원리를 나타내는 개념도.
도 8은 단일 전송 합 신호 s(n)와 부가적 공간 큐를 가진 스테레오 또는 다채널 오디오신호를 발생하기 위해 BCC 디코더에서 사용될 수 있는 도 4의 BCC 합성기의 실시예를 나타낸 블록 다이어그램.
도 9는 ICTD 및 ICLD가 서브밴드에서 주파수의 함수로서 어떻게 변화하는 지를 나타낸 그래프.
도 10은 본 발명의 하나의 실시예에 따라 도 2의 인코더와 같은 BCC 인코더에 부가되는 시간 영역 처리 장치의 블록 다이어그램.
도 11은 도 4의 BCC 합성기에서 TP 처리에 대한 시간 영역 응용의 예시도.
도 12의(A) 및 (B)는 도 10의 TPA 및 도 11의 TP에 대한 가능한 실시예를 나타낸 블록 다이어그램.
도 13은 본 발명의 다른 실시예에 따라 도 2의 인코더와 같은 BCC 인코더에 부가되는 주파수 영역 처리 장치의 블록 다이어그램.
도 14는 도 4의 BCC 합성기에서 TP 처리에 대한 주파수 영역 응용의 예시도.
도 15는 본 발명의 또 다른 실시예에 따라 도 2의 인코더와 같은 BCC 인코더에 부가되는 주파수 영역 처리 장치의 블록 다이어그램.
도 16은 도 4의 BCC 합성기에서 TP 처리에 대한 주파수 영역 응용의 다른 예시도.
도 17 (A)-(C)는 도 15 및 도 16의 TPA와 도 16의 ITP 및 TP에 대한 가능한 실시예를 나타낸 블록 다이어그램.
도 18 (A) 및 (B)는 도 16의 제어 블록에 대한 2가지 동작 모드를 나타내는 예시도.
바이노럴 큐 코딩(BCC) 방법에서, 인코더는 C개 입력 오디오 채널을 인코딩하여 E개의 전송 오디오 채널을 발생한다 (여기서 C
Figure 112007028275678-PCT00006
E
Figure 112007028275678-PCT00007
1). 특히, 2개 또는 그 이상의 C 입력 채널은 주파수 영역으로 제공되고, 하나 또는 그 이상의 큐 코드가 주파수 영역에서 2개 또는 그 이상의 입력 채널의 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 대해 생성된다. 부가적으로, C개 입력 채널은 다운믹싱되어 E개 전송 채널을 생성한다. 다운믹싱 방법에 있어서, 적어도 하나의 E개 전송 채널이 2개 또는 그 이상의 C 입력 채널에 기반을 두고 실시되는 경우도 있고, 적어도 하나의 E개 전송 채널이 단지 하나의 C 입력 채널에 기반을 둔 것도 있다.
하나의 실시예에서, BCC 인코더는 2개 또는 그 이상의 필터 뱅크, 코드 추정기, 그리고 다운믹서로 구성된다. 2개 또는 그 이상의 필터 뱅크는 2개 또는 그 이상의 C 입력 채널을 시간 영역에서 주파수 영역으로 변환한다. 코드 추정기는 2개 또는 그 이상의 변환된 입력 채널에서 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 대해 하나 또는 그 이상의 큐 코드를 생성한다. 다운믹서는 C 입력 채널을 다운믹싱하여 E개의 전송 채널을 발생한다 (여기서 C
Figure 112007028275678-PCT00008
E
Figure 112007028275678-PCT00009
1).
BCC 디코딩에 있어, E개 전송된 오디오 채널이 디코딩되어 C개의 재생 오디오 채널을 생성한다. 특히, 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 대 해, 하나 또는 그 이상의 E개 전송된 채널은 주파수 영역에서 업믹싱되어 주파수 영역에서 2개 또는 그 이상의 C 재생 채널을 생성한다 (여기서 C
Figure 112007028275678-PCT00010
E
Figure 112007028275678-PCT00011
1)(여기서 기호 "
Figure 112007028275678-PCT00012
" 는 "
Figure 112007028275678-PCT00013
" 와 같은 의미로 사용한다). 또한 하나 또는 그 이상의 큐 코드가 주파수 영역에서 2개 또는 그 이상의 재생 채널의 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 가해져 2개 또는 그 이상의 수정된 채널을 생성하고, 이 2개 또는 그 이상의 수정된 채널은 주파수 영역으로부터 시간 영역으로 변환된다. 업믹싱 방법에서, 적어도 하나의 C 재생 채널은 적어도 하나의 E개 전송된 채널과 적어도 하나의 큐 코드에 기반을 두고 실시되거나 어떤 경우 적어도 하나의 C 재생 채널이 단지 하나의 E 전송 채널과 큐 코드에 무관하게 실시되는 것도 있다.
하나의 실시예에 있어서, BCC 디코더는 업믹서, 합성기, 그리고 하나 또는 그 이상의 역 필터 뱅크로 구성된다. 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 대해, 업믹서는 주파수 영역에서 하나 또는 그 이상의 E 전송 채널을 업믹싱하여 주파수 영역에서 2개 또는 그 이상의 C 재생 채널을 생성한다 (여기서 C
Figure 112007028275678-PCT00014
E
Figure 112007028275678-PCT00015
1). 합성기는 주파수 영역에서 2개 또는 그 이상의 재생 채널의 하나 또는 그 이상의 서로 다른 주파수 밴드 각각에 하나 또는 그 이상의 큐 코드를 가하여 2개 또는 그 이상의 수정된 채널을 생성한다. 하나 또는 그 이상의 역 필터 뱅크는 2개 또는 그 이상의 수정된 채널을 주파수 영역으로부터 시간 영역으로 변환한다.
특정한 실시에 의하면, 소정의 재생 채널은 2개 또는 그 이상의 전송 채널 조합보다는 단일의 전송 채널에 기반을 둔다. 예를 들어, 단일의 전송 채널이 존재 할 때, 각각의 C 재생 채널은 그 하나의 전송 채널에 기반을 둔다. 이 경우, 업믹싱은 대응하는 전송 채널의 복사 동작에 해당한다. 위와 같이, 단일 전송 채널만이 존재할 때, 업믹서는 각 재생 채널에 대한 전송 채널을 복사하는 복사기로 실시될 수 있다.
BCC 인코더 및/또는 디코더는 예를 들어 디지털 비디오 녹화기/재생기, 디지털 녹음기/재생기, 컴퓨터, 위성 송신기/수신기, 유선 송신기/수신기, 지상파 방송 송신기/수신기, 가정 오락 시스템, 및 무비 시어터 시스템을 포함하는 다수의 시스템 또는 어플리케이션에 통합될 수 있다.
일반적 BCC 처리
도 2는 일반적인 바이노럴 큐 코딩(BCC) 오디오 처리 시스템(200)을 나타낸 것으로서 인코더(202)와 디코더(204)를 포함하고 있다. 인코더(202)는 다운믹서(206)와 BCC 추정기(208)를 포함한다.
다운믹서(206)는 C개의 입력 오디오 채널 xi(n)을 E개의 전송 오디오 채널 yi(n)으로 변환한다(여기서 C
Figure 112007028275678-PCT00016
E
Figure 112007028275678-PCT00017
1). 본 명세서에서, 변수 n을 사용하여 표시한 신호는 시간 영역 신호이며, 변수 k를 사용하여 표시한 신호는 주파수 영역 신호이다. 특정한 실시에 따라, 다운믹싱은 시간 영역 또는 주파수 영역에서 실시될 수 있다. BCC 추정기(208)는 C개의 입력 오디오 채널로부터 BCC 코드들을 생성하고, 이 BCC 코드들을 E개의 전송 오디오 채널에 관한 밴드 내 또는 밴드 외의 부수 정보로서 전송한다. 전형적인 BCC 코드들은 입력 채널 중 소정의 쌍 간에 주파수 및 시간의 함수로서 추정된 하나 또는 그 이상의 채널간 시간 차(ICTD), 채널간 레벨 차(ICLD), 및 채널간 상관관계(ICC) 데이터를 포함한다. 이 특정한 실시에서, 입력 채널중 어떤 특정한 채널 쌍 사이에서 BCC 코드가 추정될 것인지를 결정한다.
ICC 데이터는 음원의 지각된 폭에 관계하고 있는 바이노럴 신호의 결합 긴밀도에 해당한다. 음원의 폭이 넓을수록 발생한 바이노럴 신호의 좌측 및 우측 채널 간의 결합 긴밀도가 낮아진다. 예를 들어, 청중석으로 퍼져나간 오케스트라에 대응하는 바이노럴 신호의 긴밀도는 바이올린 독주에 대응하는 바이노럴 신호의 긴밀도에 비해 낮다. 일반적으로, 낮은 긴밀도의 오디오신호는 통상 가청 공간에서 많이 전개된 음원으로 지각된다. 이와 같이, ICC 데이터는 통상 외견상 음원의 폭과 청취자 포위 정도에 관련된다. 이에 대해서는 논문, J. Blauert, "The Psychophysics of Human Sound Localization", MIT Press, 1983 을 참고할 수 있다.
특정한 응용 예에 의하면, E개의 전송된 오디오 채널과 이에 대응하는 BCC 코드들은 디코더(204)로 직접 전송되거나 적절한 형태의 기억장치에 저장되어 디코더(204)에서 나중에 처리하게 할 수 있다. 상황에 따라, 용어 "전송"은 디코더로의 '직접 전송' 또는 디코더로 나중에 제공하기 위한 '저장'을 지칭할 수 있다. 어느 경우라도, 디코더(204)는 전송된 오디오 채널과 부수 정보를 수신한 다음 그 BCC 코드를 사용하여 업믹싱 및 BCC 합성을 수행함으로써, 오디오 재생을 위해 E개의 전송된 오디오 채널을 E개 이상(통상 C개 이거나 그렇지 않은)의 재생 오디오 채널
Figure 112007028275678-PCT00018
으로 변환한다. 특정한 실시에 따라, 업믹싱은 시간 영역 또는 주파수 영역에 서 수행될 수 있다.
도 2에 나타낸 BCC 처리 장치에 부가하여, 일반적으로 BCC 오디오 처리 시스템은 인코더에서 오디오신호를 더 압축하고 나중에 디코더에서 오디오신호를 압축해제하기 위해 부가적인 인코딩 및 디코딩 단을 포함할 수 있다. 이와 같은 오디오 코덱은 펄스 부호 변조(PCM), 차분 PCM(DPCM), 또는 적응 DPCM(ADPCM)에 기반을 둔 것과 같은 통상적인 오디오 압축/압축해제 기술에 기반을 둘 수 있다.
다운믹서(206)가 하나의 합 신호(즉, E=1)를 생성할 경우, BCC 코딩은 모노 오디오신호를 표현하는 데 필요한 것보다 단지 약간 더 높은 비트율로 다채널 오디오신호를 표현할 수 있다. 이것은 채널 쌍 사이에서 추정된 ICTD, ICLD, 및 ICC 데이터가 오디오 파형보다 약 2배 적은 정보를 포함하기 때문이다.
낮은 비트율의 BCC 코딩뿐만 아니라 그가 가진 하향 호환성이 중요하다. 하나의 전송된 합 신호는 원시 스테레오 신호의 모노 다운믹스 또는 다채널 신호에 해당한다. 스테레오 또는 다채널 오디오 재생을 지원하지 않은 수신기에서, 전송된 합 신호를 청취하는 것은 낮은 프로파일의 재생 장치에서 소리를 표현하는 유효한 방법이라 할 수 있다. 따라서, BCC 코딩은 모노 오디오를 다채널 오디오로 전달하는 것이 필요한 현존의 서비스를 향상하는데 사용될 수 있다. 예를 들어, BCC 부수 정보가 현존하는 전송 채널에 삽입될 수만 있다면, 현존하는 모노 오디오 라디오 방송 시스템은 스테레오 또는 다채널 재생으로 향상될 수 있는 것이다. 다채널 오디오 신호를 스테레오 오디오에 해당하는 2개의 합 신호로 다운믹싱할 때에도 유사한 기능이 존재한다.
BCC 방법은 소정의 시간 및 주파수 해상도를 가지고 오디오신호를 처리한다. 사용되는 주파수 해상도는 사람의 청각 시스템이 가진 주파수 해상도에 의해 크게 영향을 받는다. 음향심리학에서는 공간 지각이 소리 입력 신호에 대한 중요한 밴드 표현에 대부분 기반을 두고 있음을 시사하고 있다. 이 주파수 해상도는 밴드 폭이 사람의 청각 시스템의 중요한 밴드 폭과 동일하거나 그에 비례하는 서브밴드를 가진 가역 필터 뱅크(예를 들어 고속 푸리에 변환(FFT) 또는 직각 미러 필터(QMF)에 기반을 둔)를 사용하는 것에 의해 결정된다.
일반적인 다운믹싱
바람직한 실시에서, 전송된 합 신호(들)은 입력 오디오 신호의 모든 신호 성분을 포함한다. 이것은 각 신호 성분을 완전히 유지하기 위한 것이다. 오디오 입력 채널을 단순히 합산하는 것은 때때로 신호 성분의 증폭 또는 감쇄를 유발한다. 다시 말해, '단순한' 합으로 된 신호 성분의 출력(power)은 각 채널의 대응하는 신호 성분의 출력 합보다 더 크거나 작게 된다. 합 신호에서 신호성분의 출력이 모든 입력 채널에서의 대응하는 출력과 대략 동일하게 되는 것과 같이 하여 합 신호를 균등하게 하는 다운믹싱 기술이 사용될 수 있다.
도 3은 BCC 시스템(200)의 소정의 실시에 따라 도 2의 다운믹서(206)에 대해 사용할 수 있는 다운믹서(300)의 블록 다이어그램을 나타낸다. 다운믹서(300)는 각 입력 채널 xi(n)에 대한 필터 뱅크(FB: 302)와, 다운믹싱 블록(304), 선택적 스케일 링/지연 블록(306), 및 각 인코딩된 채널 yi(n)에 대한 역 필터 뱅크(IFB: 308)로 구성된다.
각 필터 뱅크(302)는 시간 영역에 있는 해당 디지털 입력 채널 xi(n)의 각 프레임(예를 들어 20 msec)을 주파수 영역에 있는 일단의 입력 계수
Figure 112007028275678-PCT00019
로 변환한다. 다운믹싱 블록(304)은 C개의 대응하는 입력 계수의 각 서브밴드를 E개의 다운믹싱된 주파수 영역 계수의 대응하는 서브밴드로 다운믹싱 한다. 아래의 식(1)은 입력 계수
Figure 112007028275678-PCT00020
의 k번째 서브밴드를 다운믹싱하고, 다운믹싱된 계수
Figure 112007028275678-PCT00021
의 k번째 서브밴드를 생성함을 표현한다.
Figure 112007028275678-PCT00022
(1)
여기서,
Figure 112007028275678-PCT00023
는 실수값의 C-by-E 다운믹싱 행렬이다.
선택적 스케일링/지연 블록(306)은 일단의 승산기(310)를 포함하며, 그 각각의 승산기는 대응하는 다운믹싱된 계수
Figure 112007028275678-PCT00024
를 스케일링 팩터 ei(k)로 곱하여 대응하는 스케일링된 계수
Figure 112007028275678-PCT00025
를 생성한다. 스케일링 동작의 유도는 각 채널에 대해 임의의 가중 팩터를 가지고 다운믹싱을 위해 종합된 균등화와 같다. 입력 채널이 독립적이면, 각 서브밴드에서 다운믹싱된 신호의 출력
Figure 112007028275678-PCT00026
는 다음의 식 (2)로 표현된다.
Figure 112007028275678-PCT00027
(2)
여기서,
Figure 112007028275678-PCT00028
는 C-by-E 다운믹싱 행렬
Figure 112007028275678-PCT00029
에서 각 행렬의 성분을 제곱하는 것에 의해 유도되고,
Figure 112007028275678-PCT00030
는 입력 채널 i의 서브밴드 k의 출력(power)이다.
서브밴드가 독립적이면, 다운믹싱된 신호의 출력
Figure 112007028275678-PCT00031
은 신호 성분들이 맞음 위상 또는 틀림 위상으로 될 때 신호가 증폭되거나 없어지는 현상 때문에 식 (2)를 사용하여 계산한 것보다 더 크거나 작아진다. 이를 방지하기 위해, 식 (1)의 다운믹싱 동작이 승산기(310)의 스케일링 동작에 후속하여 서브밴드로 가해진다. 스케일링 팩터 ei(k)(1#i#E)는 다음의 식 (3)을 사용하여 유도될 수 있다.
Figure 112007028275678-PCT00032
(3)
여기서,
Figure 112007028275678-PCT00033
는 식(2)에 의해 계산된 서브밴드의 출력이며,
Figure 112007028275678-PCT00034
는 대응하는 다운믹싱된 서브밴드 신호
Figure 112007028275678-PCT00035
의 출력(power)이다.
선택적 스케일링에 부가하여, 또는 그 대신에 스케일링/지연 블록(306)은 선택적으로 신호에 지연을 가할 수 있다.
각각의 역 필터 뱅크(IFB: 308)는 주파수 영역에 있는 대응하는 일단의 스케일링된 계수를, 대응하는 디지털 전송 채널 yi(n)의 프레임으로 변환한다.
도 3에서 모든 C 입력 채널이 후속 다운믹싱 동작을 위해 주파수 영역으로 변환되는 것으로 나타내고 있지만, 다른 실시로서, 하나 또는 그 이상의 (C-1 보다 작은) C 입력 채널이 도 3에 나타낸 몇 가지 또는 모든 처리를 건너뛰고 수정되지 않은 오디오 채널에 상당하는 수로서 전송될 수 있다. 특정한 실시에 따르면, 이들 수정되지 않은 오디오 채널은 전송 BCC 코드를 생성하기 위해 도 2의 BCC 추정기(208)에서 사용되거나 사용되지 않을 수 있다.
단일의 합 신호 y(n)를 생성하는 다운믹서(300)의 실시예에서, E=1 및 각 입력 채널 c의 각 서브밴드 신호
Figure 112007028275678-PCT00036
가 합산되고 나서 다음의 식(4)에 따라 팩터 e(k)로 승산된다:
Figure 112007028275678-PCT00037
(4)
팩터 e(k)는 다음의 식(5)에 의해 구해진다:
Figure 112007028275678-PCT00038
(5)
여기서,
Figure 112007028275678-PCT00039
는 시간 지수 k에서
Figure 112007028275678-PCT00040
의 출력의 단시간 추정치이며,
Figure 112007028275678-PCT00041
Figure 112007028275678-PCT00042
의 출력에 대한 단시간 추정치이다. 균등화된 서브밴드들은 다시 시간 영역으로 전환되어 BCC 디코더로 전송될 합 신호 y(n)를 발생한다.
일반적 BCC 합성
도 4는 BCC 시스템(200)의 소정 실시예에 따라, 도 2의 디코더(204)로서 사용될 수 있는 BCC 합성기(400)의 블록 다이어그램을 나타낸다. BCC 합성기(400)는 각 전송 채널 yi(n)에 대해 마련된 필터 뱅크(402)와, 업믹싱 블록(404), 지연기(406), 승산기(408), 상관관계 블록(410), 그리고 각 재생 채널
Figure 112007028275678-PCT00043
에 대한 역 필터 뱅크(412)로 구성된다.
각 필터 뱅크(402)는 시간 영역에 있는 대응하는 디지털 전송 채널 yi(n)의 각 프레임을 주파수 영역에서 일단의 입력 계수
Figure 112007028275678-PCT00044
로 변환한다. 업믹싱 블록(404)은 E개의 대응하는 전송된 채널 계수의 각 서브밴드를 C개의 업믹싱된 주파수 영역 계수의 대응 서브밴드로 업믹싱 한다. 전송된 채널 계수
Figure 112007028275678-PCT00045
의 k번째 서브밴드를 업믹싱 하여 업믹싱된 계수
Figure 112007028275678-PCT00046
의 k번째 서브밴드를 생성하는 과정을 아래의 식 (6)으로 표시하였다:
Figure 112007028275678-PCT00047
(6)
여기서,
Figure 112007028275678-PCT00048
는 실수값의 E-by-C 업믹싱 행렬이다. 주파수 영역에서 업믹 싱을 수행하는 것은 각각의 서로 다른 서브밴드에 업믹싱이 개별적으로 적용될 수 있게 한다.
각 지연 수단(406)은 ICTD 데이터에 대한 대응하는 BCC 코드에 근거하여 지연 값 di(k)를 가함으로써 소망하는 ICTD 값이 재생 채널의 소정 쌍 사이에서 나타날 수 있게 한다. 각 승산기(408)는 ICLD 데이터에 대한 대응하는 BCC 코드에 근거하여 스케일링 팩터 ai(k)를 가함으로써 소망하는 ICLD 값이 재생 채널의 소정 쌍 사이에서 나타날 수 있게 한다. 상관관계 블록(410)은 ICC 데이터에 대한 대응하는 BCC 코드에 근거하여 상관관계 해제 동작을 수행함으로써 소망하는 ICC 값이 재생 채널의 소정 쌍 사이에서 나타날 수 있게 한다. 상관관계 블록(410)의 동작에 대한 부가적인 설명은 2002년 5월 24일자 미합중국 특허출원 제 10/155,437호에서 찾아볼 수 있다.
ICLD 합성은 단지 서브밴드 신호의 스케일링 동작을 포함하기 때문에, ICLD 값의 합성은 ICTD 및 ICC 값의 합성에 비해 덜 곤란하다. ICLD 큐는 가장 보편적으로 사용되는 방향성 큐이기 때문에 ICLD 값을 원시 오디오 신호의 ICLD 값에 근사하게 하는 것이 보다 중요하다. 이와 같이, ICLD 데이터는 모든 채널 쌍 사이에서 추정된다. 각 서브밴드에 대한 스케일링 팩터 ai(k)(1#i#C)는 바람직하게 각 재생 채널의 서브밴드 출력이 원시 입력 오디오 채널의 대응하는 출력에 가까워지게 선택된다.
ICTD 및 ICC 값을 합성하기 위해서는 상대적으로 신호에 대한 수정을 거의 가하지 않는다. 이와 같이, BCC 데이터는 모든 채널 쌍에 대한 ICTD 및 ICC 값을 포함하지 않는다. 여기서, BCC 합성기(400)는 소정의 채널 쌍 사이에서 ICTD 및 ICC 값만을 합성한다.
각각의 역 필터 뱅크(412)는 주파수 영역에 있는 대응하는 일단의 합성된 계수
Figure 112007028275678-PCT00049
를 대응하는 디지털 재생 채널
Figure 112007028275678-PCT00050
의 프레임으로 변환한다.
도 4에서, 후속하는 업믹싱 및 BCC 처리를 위해 모든 E개의 전송된 채널이 주파수 영역으로 변환되고 있음을 나타내고 있지만, 다른 실시에서는 하나 또는 그 이상의(전부는 아닌) E개 전송된 채널이 도 4에 나타낸 처리의 일부 또는 전부를 건너뛰게 할 수 있다. 예를 들어, 하나 또는 그 이상의 전송된 채널은 업믹싱 되지 않을 수정 안 된 채널로 될 수 있다. 하나 또는 그 이상의 C개 재생 채널로 되는 것에 부가하여, 그 수정되지 않은 채널은 강제적이지 않지만 하나 또는 그 이상의 다른 재생 채널을 합성하기 위해 BCC 처리가 적용되는 기준 채널로서 사용된다. 양자의 어느 경우에도, 그와 같은 수정되지 않은 채널은, 나머지 재생 채널을 생성하는데 사용하는 업믹싱 및/또는 BCC 처리에 관련된 처리 시간을 보상하기 위해 지연될 수 있다.
도 4에서 C개의 재생 채널이(C는 또한 원시 입력 채널의 수) E개 전송된 채널로부터 합성되고 있음을 나타내고 있지만, BCC 합성은 그 재생 채널의 수에 제한받지 않는다. 일반적으로, 재생 채널의 수는 C보다 크거나 작은, 그리고 재생 채널의 수가 전송된 채널의 수와 동일하거나 작은 경우를 포함하는 어떤 수의 채널이라 도 가능하다.
오디오 채널 간의 "청각 관련 차이"
단일의 합 신호를 가정할 때, BCC는 스테레오 또는 다채널 오디오신호를 ICTD, ICLD, 및 ICC가 원시 오디오신호의 대응하는 큐에 근사하게 되도록 합성한다. 이하에, 청각의 공간 이미지 속성에 관하여 ICTD, ICLD 및 ICC의 역할에 대해 논의한다.
공간 청력에 대한 인식은 하나의 청각 이벤트에 대해, ICTD 및 ICLD가 지각 방향에 관계하고 있음을 의미한다. 하나의 음원의 바이노럴 룸 임펄스 응답(BRIR)을 고려할 때, BRIR의 초기 및 후기 부분을 추정하면 청각 이벤트의 폭과 청취자 싸개(envelopment)와 ICC 데이터 사이에 관계가 존재한다. 그러나, ICC와 일반 신호에 대한 이들 특성(BRIR 뿐만 아니라) 사이의 관계는 간단하지 않다.
스테레오 및 다채널 오디오신호는 통상 둘러싸인 공간에서 녹음하는 것에 기인한 반사 신호 성분에 의해 중첩되거나, 공간적 느낌을 인공적으로 만들어내기 위해 녹음 기술자에 의해 가해진 동시 작용 원시 신호의 복합적 믹싱 녹음을 포함한다. 서로 다른 원시 신호 및 그들의 반사 신호는 시간-주파수 평면에서 서로 다른 영역을 점유한다. 이것은 시간 및 주파수의 함수로 변화하는 ICTD, ICLD, 및 ICC에 반영된다. 이 경우, 순간의 ICTD, ICLD, 및 ICC와 청각 이벤트의 방향, 그리고 공간적 느낌 사이의 관계는 분명하지 않다. BCC의 소정의 실시 예에서는 그들의 큐가 원시 오디오 신호의 대응하는 큐에 근접하게 되도록 큐들을 눈에 보이지 않게 합성 한다.
등가 직각 대역폭(EBR)의 2배와 동등한 서브밴드 밴드폭을 가진 필터뱅크가 사용된다. 평상적인 청취에서, 높은 주파수 해상도를 선택했을 때 BCC의 오디오 품질은 현저하게 개선되지 않는다는 것이 알려졌다. 낮은 주파수 해상도를 사용하는 것이 디코더로 전송될 필요가 있는 ICTD, ICLD, 및 ICC 값을 적게 하고 따라서 낮은 비트율을 가질 수 있기 때문에 바람직하다.
시간 해상도에 관하여, ICTD, ICLD, 및 ICC는 통상 일정한 시간 간격마다 고찰된다. ICTD, ICLD, 및 ICC가 약 4 내지 16 ms 마다 고찰될 때 높은 성능이 얻어진다. 큐가 매우 짧은 시간 간격으로 고찰되지 않는 경우, 선행 효과가 직접 고찰되지 않는다는 점을 주목해야 한다. 소리 자극의 전형적인 리드-래그(lead-lag) 쌍을 고려할 때, 이 리드-래그가 단 하나의 큐 세트가 합성되는 시간 간격에 떨어질 경우, 리드의 국소화 지배는 고려되지 않는다. 이에 불구하고, BCC는 평균 약 87 그리고 소정의 오디오 신호에 대해 거의 100에 가까운 MUSHRA 율 점수를 나타내는 오디오 품질(즉, "우수한" 오디오 품질)을 성취한다.
가끔 얻어지는 기준 신호와 합성 신호 간의 청각적으로 작은 차이는, 광범위한 청각 공간 이미지 속성에 관련한 큐가 일정 시간 간격마다 ICTD, ICLD, 및 ICC를 합성하는 것에 의해 암암리에 고찰되고 있다는 것을 의미한다. 다음에, 어떻게 ICTD, ICLD, 및 ICC가 청각 공간 이미지 속성의 일정 범위에 관련될 수 있는지에 대해 논의한다.
공간 큐의 추정
이하, 어떻게 ICTD, ICLD, 및 ICC가 추정되는지에 대해 설명한다. (양자화 및 부호화된) 공간 큐를 전송하는데 필요한 비트율은 단지 수 kb/s으로 될 수 있으며, 따라서, BCC에 의해, 스테레오 및 다채널 오디오신호를 단일 오디오 채널의 전송에 필요한 비트율에 근접한 비트율로 전송할 수 있다.
도 5는 본 발명의 실시예에 따라 도 2의 BCC 추정기(208)의 상세 블록 다이어그램을 나타낸다. BCC 추정기(208)는 도 3의 필터뱅크(302)와 동일 형식으로 될 수 있는 필터뱅크(FB: 502)와, 이 필터뱅크(502)에서 생성된 각 서로 다른 주파수 서브밴드에 대한 ICTD, ICLD, 및 ICC의 공간 큐를 발생하는 추정 블록(504)을 포함한다.
스테레오 신호에 대한 ICTD , ICLD , 및 ICC 추정
다음의 해법은 2개(즉, 스테레오) 오디오 채널의 대응하는 서브밴드 신호
Figure 112007028275678-PCT00051
Figure 112007028275678-PCT00052
에 대한 ICTD, ICLD, 및 ICC를 위해 사용된다.
o ICTD [샘플]:
Figure 112007028275678-PCT00053
(7)
정규화된 상호 상관관계 함수에 대한 단시간 추정값은 다음의 식(8)에 의해 구해진다:
Figure 112007028275678-PCT00054
(8)
여기서,
Figure 112007028275678-PCT00055
(9)
그리고
Figure 112007028275678-PCT00056
Figure 112007028275678-PCT00057
평균의 단시간 추정값이다.
o ICLD [dB]:
Figure 112007028275678-PCT00058
(10)
o ICC:
Figure 112007028275678-PCT00059
(11)
여기서, 정규화된 상호 상관관계의 절대값이 고찰되었으며 c12(k)는 [0,1]의 범위를 갖는다.
다채널 오디오 신호에 대한 ICTD , ICLD , 및 ICC 추정
2개 이상의 입력 채널이 존재할 때, C= 5인 채널에 대해 도 6에서 나타낸 것과 같이, 기준 채널(예를 들어, 채널 번호 1)과 다른 채널 사이의 ICTD 및 ICLD를 충분히 정의할 수 있다. 여기서, τ1c(k) 및 ΔL12(k)는 각각 기준 채널 1과 채널 c 사이의 ICTD 및 ICLD를 지칭한다.
ICTD 및 ICLD에 반하여, ICC는 통상 더 많은 자유도를 가진다. 정의된 ICC는 모든 입력 채널 쌍 사이에서 서로 다른 값을 가질 수 있다. C개 채널에 대해, 예를 들어, 5개 채널에 대해 도 7A에 나타낸 10개 채널 쌍과 같은, C(C-1)/2 개의 가능한 채널 쌍이 존재한다. 그러나, 이와 같은 방법은 각 시간 지수에서 각 서브채널에 대해 C(C-1)/2 개에 대한 ICC 값이 추정되고 전송되어야할 필요가 있으며, 이에 따라 높은 계산상 복잡성과 높은 비트율을 가져오게 된다.
대안적으로, 각 서브밴드에 대해, ICTD 및 ICLD는 서브밴드에서 대응하는 신호 성분의 청각적 이벤트가 주어지는 방향을 결정한다. 서브밴드당 단일의 ICC 파라미터가 모든 오디오 채널 사이의 전체 긴밀도를 표현하는데 사용될 수 있다. 각 시간 지수에서 대부분의 에너지가 각 서브밴드에 나타나게 하면서 단지 2개 채널 사이의 ICC 큐를 추정 및 전송하는 것에 의해 좋은 결과를 얻을 수 있다. 이 방법은 도 7(B)에 나타내었으며, 여기서 시간 순간 k-1 및 k에 대해 각각 채널 쌍 (3, 4)와 (1, 2)가 가장 강하다. 발견적 법칙이 다른 채널 쌍 사이의 ICC를 결정하는데 사용될 수 있다.
공간 큐의 합성
도 8은 도 4의 BCC 합성기(400)의 실시 예를 나타낸 블록 다이어그램으로, 이것은 단일의 전송된 합 신호 s(n)와 이에 부가된 공간 큐 신호가 주어진 스테레오 또는 다채널 오디오 신호를 생성하기 위한 BCC 디코더에서 사용될 수 있다. 합 신호 s(n)는 서브밴드로 분해되고, 여기서
Figure 112007028275678-PCT00060
는 하나의 서브밴드를 나타낸다. 각 출력 채널의 대응하는 서브밴드를 생성하기 위해, 지연 dc, 스케일 팩터 ac, 및 필터 hc 가 합 신호의 대응하는 서브밴드에 가해진다. (설명의 간략화를 위해, 시간 지수 k는 지연, 스케일 팩터, 및 필터에서 무시되었다.) ICTD는 지연을 가함에 의해 합성되고, ICLD는 스케일링 팩터를 가함에 의해 합성되고, ICC는 상관관계 해제 필터를 가함에 의해 합성된다. 도 8에 나타낸 처리는 각 서브밴드에 개별적으로 적용된다.
ICTD 합성
지연 dc 는 다음의 식 (12)에 의거하여, ICTD τ1c(k) 로부터 결정된다:
Figure 112007028275678-PCT00061
(12)
기준 채널에 대한 지연 d1 은 지연 dc 의 최대 크기를 최소화시키는 것과 같이 하여 계산된다. 서브밴드 신호를 보다 적게 수정하면 인공음이 발생할 우려가 작아진다. 서브밴드 샘플링 비율이 ICTD 합성을 위해 충분히 높은 시간 해상도를 제공하지 않을 경우, 적절한 전역 통과 필터를 사용하여 지연을 더 정밀하게 가할 수 있다.
ICLD 합성
출력 서브밴드 신호가 채널 c와 기준 채널 1 사이에서 소망의 ICLD ΔL12(k) 를 갖게 하기 위하여, 이득 팩터 ac 는 다음과 같은 식 (13)을 만족하여야 한다:
Figure 112007028275678-PCT00062
(13)
부가적으로, 출력 서브밴드는 바람직하게 모든 출력 채널의 출력(power) 합이 입력 합 신호의 출력(power)과 동일하게 되도록 정규화된다. 각 서브밴드에 있는 전체 원시 신호 출력이 합 신호에서 보존되고 있기 때문에, 이 정규화는 원시 인코더 입력 오디오 신호의 대응하는 출력에 근사하는, 각 출력 채널에 대한 절대 서브밴드 출력을 얻게 한다. 위와 같은 제한이 주어지면, 스케일 팩터 ac는 다음의 식 (14)에 의해 구해진다:
Figure 112007028275678-PCT00063
(14)
ICC 합성
소정의 실시예에서, ICC 합성의 목표는 지연 및 스케일링이 가해진 후, ICTD 및 ICLD에 영향을 주지 않고 서브밴드 간의 상관관계를 감소시키기 위한 것이다. 이 목적은 ICTD 및 ICLD가 주파수의 함수로서 효과적으로 변화되게 하고 그 평균 편차가 각 서브밴드(청각적으로 중요한 밴드)에서 영(0)이 되도록 도 8의 필터 hc 를 설계함으로써 이루어질 수 있다.
도 9는 ICTD 및 ICLD가 서브밴드 내에서 주파수의 함수로서 어떻게 변화하는 지를 보여준다. ICTD 및 ICLD 변화량의 진폭은 상관관계 감소 정도를 결정하며 그 진폭은 ICC의 함수로서 제어된다. 여기서, 도 9a에 나타낸 것과 같이 ICTD는 완만하게 변화되고, ICLD는 도 9b에 나타낸 것처럼 불규칙하게 변화된다. ICLD를 ICTD와 같이 완만하게 변화시킬 수 있지만, 이것은 생성된 오디오신호에 더 많은 상관관계를 주게 된다.
특히 다채널 ICC 합성에 적합한 또 하나의 ICC 합성 방법은 논문, C. Faller, "Parametric multi-channel audio coding: Synthesis of coherence cues," IEEE Trans . on Speech and Audio Proc ., 2003 에 상세히 기재되어 있고 그 개시 내용은 본 명세서에 참고로 통합되었다. 시간 및 주파수의 함수로서, 소정 량의 인공 지연 잔향을 각 출력 채널에 가하여 원하는 ICC를 얻어낸다. 부가적으로, 결과 신호의 스펙트럼 엔벌로프가 원래 오디오신호의 스펙트럼 엔벌로프에 접근되게 하는 스펙트럼 수정이 가해질 수도 있다.
스테레오 신호 (또는 오디오 채널 쌍)에 관련 있는 다른 ICC 합성 기술은 논문, E. Schuijers, W. Oomen, B. den Brinker, and J. Breebaart, "Advances in parametric coding for high-quality audio," in Preprint 114 th Conv . Aud . Eng . Soc., Mar. 2003, 및 J. Engdegard, H. Purnhagen, J. Roden, and L. Liljeryd, "Synthetic ambience in parametric stereo coding," in Preprint 117 th Conv . Aud. Eng . Soc ., May 2004 에 발표되어 있으며, 이 2가지 논문의 개시 내용은 본 명세서에 참고로 통합되었다.
C - to - E BCC
전술한 바와 같이, BCC는 하나 이상의 전송 채널을 가지고 수행될 수 있다. BCC의 변화량은 하나의 단일 (전송) 채널이 아닌 E개 채널로서의 C개 오디오 채널을 표현하는 것으로 설명되었다(C-to-E BCC 로 표시). C-to-E BCC에 대한 (적어도) 2개 요인이 존재한다:
o 하나의 전송 채널에 대한 BCC는 스테레오 또는 다채널 오디오 재생용의 기존 모노 시스템을 업그레이드하기 위한 하향 호환성 통로를 제공한다. 업그레이드된 시스템은 기존의 모노 장치를 통해 BCC 다운믹싱된 합 신호를 전송하는 한편 BCC 부수 정보를 부가적으로 전송한다. C-to-E BCC 는 C개 채널 오디오신호의 E개 채널 하향 호환성 코딩에 적용할 수 있다.
o C-to-E BCC 는 전송 채널 수 감소의 상이한 정도에 대한 조정가능성을 유도한다. 전송되는 오디오 채널이 많을수록 오디오의 품질이 향상될 것으로 기대된다.
ICTD, ICLD, 및 ICC 큐를 정의하는 방법과 같은 C-to-E BCC의 신호 처리 과정들은 2004년 1월 20일자 미합중국 특허출원 제 10/762,100호 (대리인 명부 번호 Faller 13-1)에 설명되어 있다.
개별 채널 정형
소정의 실시예에서, 하나의 전송 채널을 가진 BCC와 C-to-E BCC 는 ICTD, ICLD, 및/또는 ICC 합성을 위한 알고리즘을 포함한다. 통상, 약 4 내지 30 ms 마다 ICTD, ICLD, 및/또는 ICC 큐를 합성할 수 있다. 그러나, 선행 효과의 청각 현상은 사람의 청각 시스템이 높은 시간 해상도(예를 들어 1 내지 10 ms 마다)에서 큐를 판정할 때 특정한 순간이 존재한다는 것을 나타낸다.
단일의 정적 필터 뱅크는 모든 순간에 적합한 충분히 높은 주파수 해상도를 제공하지 못하지만, 선행 효과가 효과적일 때 순간마다 충분히 높은 시간 해상도를 제공한다.
본 발명의 소정의 실시예는 높은 시간 해상도가 필요한 경우 순간에 접근하기 위해 부가적인 처리를 가하면서 비교적 낮은 시간 해상도의 ICTD, ICLD, 및/또는 ICC 합성을 사용하는 시스템에 관련된다. 또한, 소정의 실시예에서, 이 시스템은 시스템 구조상 일반적으로 통합하기 어려운 신호 적응 윈도우 스위칭 기술을 사용할 필요성을 제거한다. 소정의 실시예에서, 하나 또는 그 이상의 원시 인코더 입력 오디오 채널의 시간 엔벌로프가 평가된다. 이 평가는 예를 들어 신호의 시간 구조를 분석하는 것에 의해 직접적으로 또는 주파수에 대해 신호 스펙트럼의 자기상관 정도를 검사하는 것으로 이루어진다. 이 2가지 접근 방법은 이후의 실시 예에서 상세히 설명된다. 엔벌로프에 포함된 정보는 청각적으로 필요하고 이용할만할 때 (엔벌로프 큐 코드로서) 디코더로 전송된다.
소정의 실시예에서, 디코더는 소정의 처리를 가하여 소망의 시간 엔벌로프를 그 출력 오디오 채널에 부과한다:
o 이것은 TP 처리, 예를 들어 신호의 시간 영역 샘플들을 시간-변화 진폭 수정 함수로 승산 하는 것과 같이 신호의 엔벌로프를 조작하는 것에 의해 달성된다. 서브밴드의 시간 해상도가 충분히 높을 때(거치른 주파수 해상도의 대가로), 유사 한 처리가 스펙트럼/서브밴드 샘플에 가해질 수 있다.
o 대안적으로, 주파수에 대한 신호의 스펙트럼 표현의 콘볼루션/필터링이 낮은 비트율의 오디오 인코더에서 발생한 양자화 잡음을 정형하거나 인텐시티 스테레오 인코딩된 신호의 질을 높이기 위해 종래 기술에서 사용된 것과 유사한 방식으로 사용될 수 있다. 이 방법은 필터 뱅크가 높은 주파수 해상도를 가진 경우, 따라서 낮은 시간 해상도를 가진 경우에 바람직하다. 콘볼루션/필터링 방법에서:
o 엔벌로프 정형 방법은 인텐시티 스테레오에서 C-to-E 다채널 코딩으로 확장된다.
o 그 기술은 엔벌로프 정형이 인코더에서 발생한 파라메트릭 정보(예를 들어 2진 플래그)에 의해 제어되게 하는, 그 제어가 실제로 디코더에서 유도한 필터 계수 세트에 의해 수행되게 하는 설정(셋업)을 포함한다.
o 또 하나의 설정에서, 예를 들어 청각적으로 필요 및/또는 유익할 경우, 필터 계수의 집합이 인코더로부터 전송된다.
시간 영역/서브밴드 영역에 대한 접근 방법 또한 위와 같다. 따라서, 엔벌로프 정보의 전송을 부가적으로 제어하기 위해 평가기준(예를 들어, 과도 신호 검출 또는 음조 평가)이 도입될 수 있다.
가능한 인공음 발생을 예방하기 위하여 TP 처리를 디스에이블시키는 것이 적합할 때가 있을 수 있다. 신중을 기하기 위해, 시간 처리를 기정 값으로 디스에이블로 설정하는 (즉, BCC가 통상의 BCC 방법에 따라 동작하게 하는)것이 좋다. 채널을 더 높은 시간 해상도로 처리하는 것이 개선을 가져온다고 예측될 경우, 예를 들 어 선행 효과가 활성적으로 된다고 예측할 경우에만 부가적인 처리가 인에이블 된다.
전술한 바와 같이, 이와 같은 인에이블링/디스에이블링 제어는 과도 신호 검출에 의해 수행될 수 있다. 즉, 과도 신호가 검출된 경우, TP 처리가 인에이블된다. 선행 효과는 과도 신호에 가장 효과적이다. 과도 신호 검출은 예견능력을 사용하여 단일의 과도 신호는 물론 이 과도 신호 바로 앞뒤의 신호 성분까지 유효하게 정형한다. 과도 신호 검출의 가능한 방법은 다음을 포함한다:
o BCC 인코더 입력 신호의 시간 엔벌로프 또는 전송된 BCC 합 신호(들)을 관찰한다. 출력에 급격한 증가가 있을 경우, 과도 신호가 발생한 것이다.
o 인코더 또는 디코더에서 추정된 선형 예측 코딩(LPC) 이득을 검사한다. LPC 예측 이득이 소정의 임계값을 초과할 경우, 신호가 순간적이거나 크게 동요하는 것으로 추정될 수 있다. LPC 분석은 스펙트럼의 자기상관관계에 대해 계산된다.
부가적으로, 음조 신호에서 발생가능한 인공음을 방지하기 위해, 전송된 합 신호의 음색이 높을 때 바람직하게 TP 처리를 가하지 않는다.
본 발명의 소정 실시예에 따르면, 개별 원시 오디오 채널의 시간 엔벌로프는 BCC 디코더가 원시 오디오 채널의 시간 엔벌로프와 유사한 (또는 청각적으로 유사한) 시간 엔벌로프를 가진 출력 채널을 생성할 수 있도록 인코더에서 추정된다. 본 발명의 소정의 실시예는 선행 효과에 대한 현상을 다룬다. 본 발명의 소정의 실시예는 ICLD, ICTD, 및/또는 ICC와 같은 다른 BCC 코드에 부가하여 BCC 부수 정보의 일부로서 엔벌로프 큐 코드를 전송하는 것을 포함한다.
본 발명의 소정의 실시예에서, 시간 엔벌로프에 대한 시간 해상도는 다른 BCC 코드(예를 들어, ICLD, ICTD, ICC)의 시간 해상도에 비해 미세하다. 이것은 다른 BCC 코드가 유도될 입력 채널의 하나의 블록 길이에 해당하는 합성 윈도우에 의해 제공된 기간 내에 엔벌로프 정형이 수행될 수 있게 한다.
실시 예
도 10은 본 발명의 하나의 실시예에 따라 도 2의 인코더(202)와 같은 BCC 인코더로 가해지는 시간 영역 처리를 위한 블록 다이어그램을 나타낸다. 도 10(A)에 나타낸 것과 같이, 각 시간 처리 분석기(TPA: 1002)는 일반적으로 하나 또는 그 이상의 입력 채널 어느 것이라도 분석할 수 있는 것이지만 서로 다른 원시 입력 채널xc(n)의 시간 엔벌로프를 추정한다.
도 10(B)는 TPA(1002)에 대한 시간 영역 기반 실시예의 블록 다이어그램을 나타낸 것이며, 여기서 입력 신호 샘플들이 제곱되고(1006), 저역 통과 필터링 되어(1008) 입력신호의 시간 엔벌로프를 특징 지우게 된다. 다른 실시예에서, 시간 엔벌로프는 자기상관관계/LPC 방법을 사용하거나 다른 방법, 예를 들어 힐버트 변환을 사용하여 추정될 수 있다.
도 10(A)의 블록 (1004)는 도 2의 부수 정보에 포함될 시간 처리(TP) 정보(즉, 엔벌로프 큐 코드)로서 전송되기 전에 추정된 시간 엔벌로프를 파라미터화, 양자화, 및 부호화시킨다.
하나의 실시예에서, 블록(1004) 내의 검출기(도시되지 않음)는 디코더에서의 TP 처리가 음질을 향상시킬 것인지 여부를 판단하여 TP 처리에 의해 음질이 향상되는 순간 동안만 블록(1004)이 TP 부수 정보를 전송하게 한다.
도 11은 도 4의 BCC 합성기(400)에 관련한 TP 처리의 시간 영역 응용예를 나타낸다. 이 실시예에서, 단일의 전송된 합 신호 s(n)가 존재하고, C 기저 신호는 합 신호를 복제하는 것으로 생성된다. 엔벌로프 정형은 개별적으로 서로 다른 합성된 채널에 가해진다. 다른 실시예에서는 지연, 스케일링, 및 다른 처리의 순서를 달리할 수 있다. 더욱이, 이 다른 실시예에서, 엔벌로프 정형은 각 채널을 독립적으로 처리하는 것에 제한되지 않는다. 이것은 특히 콘볼루션/필터링 기반 실시예가 주파수 밴드 전체의 긴밀성을 이용하여 신호의 시간적 미세 구조를 틀림없이 유도하게 한다.
도 11(A)에서, 디코딩 블록(1102)은 BCC 인코더로부터 수신된 전송 TP 부수 정보로부터 각각의 출력 채널에 대한 시간 엔벌로프 신호 a를 복구하고, 각각의 TP 블록(1104)은 대응하는 엔벌로프 정보를 가하여 출력 채널의 엔벌로프를 정형한다.
도 11(B)는 TP(1104)에 대한 하나의 가능한 시간 영역 기반 실시예의 블록 다이어그램을 나타낸 것으로, 합성된 신호 샘플이 제곱되고(1106), 저역 통과 필터링 되어(1108) 합성된 채널의 시간 엔벌로프 b를 특징 지우게 된다. 스케일 팩터(예를 들어, a/b의 제곱근)가 생성(1110)된 다음 합성된 채널로 가해져서(1112) 대응하는 원시 입력 채널의 시간 엔벌로프와 실질적으로 동일한 시간 엔벌로프를 갖는 출력 채널을 생성한다.
도 10의 TPA(1002) 및 도 11의 TP(1104)에 대한 다른 실시예에서, 시간 엔벌로프는 신호 샘플을 제곱하기 보다는 크기 연산을 이용하여 특징 지워진다. 그와 같은 실시예에서, 제곱근 연산을 적용할 필요없이 스케일 팩터로서 a/b 비를 사용할 수 있다.
도 11(c)의 스케일링 연산이 TP 처리의 시간 영역 기반 실시예에 대응한다 할지라도, TP 처리(TPA 및 역 TP(ITP)처리도 마찬가지)는 도 16-17의 실시예(이후에 설명함)에서와 같이 주파수 영역 신호를 사용하여 실시될 수도 있다. 그와 같이, 본 명세서에서 용어 "스케일링 함수"는 도 17(B) 및 도 17(C)의 필터링 동작과 같은 시간 영역 또는 주파수 영역 연산 모두에 적용되는 것으로 해석되어야 한다.
일반적으로, 각 TP(1104)는 바람직하게 신호 출력 (즉, 에너지)를 수정하지 않도록 설계된다. 특정한 실시에 있어서, 이 신호 출력은 예를 들어 합성 윈도우에 의해 정의된 기간에서의 채널당 전체 신호 출력 또는 다른 적당한 출력 측정 방법에 기반하여 각 채널에서의 단시간 평균 신호 출력으로 될 수 있다. 이와 같이, ICLD 합성을 위한 스케일링은 (예를 들어, 승산기(408)을 사용한) 엔벌로프 정형 이전 또는 이후에 적용될 수 있다.
BCC 출력 신호의 전체 밴드에 대한 스케일링이 인공음을 발생할 수 있기 때문에, 엔벌로프 정형은 특정 주파수, 예를 들어 소정의 차단 주파수 fTP (예를 들어, 500 Hz) 보다 높은 주파수에 대해서만 적용된다.
도 12(A)와 (B)는 도10의 TPA 1002 및 도 11의 TP1104의 가능한 실시예를 보 여 준다. 여기서 엔베로프 정형 차단 주파수 fTP 보다 높은 주파수에 대하여만 적용된다. 특히 도 12(A)에서 하이패스 필터 (1202)를 보여주고 있는데, 이 것은 시간 엔벌로프를 특징 짓기 이전에 차단주파수 fTP 보다 낮은 주파수를 필터링 한다. 도 12(B)는 2개 서브밴드 사이의 차단 주파수 fTP 를 갖는 2-밴드 필터뱅크(1204)가 추가되어 있는 것을 나타내며, 여기서 높은 주파수 부분만이 일시적으로 정형된다. 이후 2-밴드 역 필터뱅크(1206)는 낮은 주파수 부분을 일시적으로 정형된 높은 주파수 부분과 재결합하여 출력 채널을 생성한다.
도 13은 본 발명의 대체 실시예에 따라, 도 2의 인코더(202)와 같은 BCC 인코더에 부가되는 주파수 영역 처리에 대한 블록 다이어그램을 나타낸다. 도 13(A)에 나타낸 바와 같이, 각 TPA(1302)의 처리는 서로 다른 서브밴드에 개별적으로 적용된다. 각 필터뱅크(FB)는 도 3의 대응하는 FB(302)와 동일하고, 블록(1304)는 도 10의 블록(1004)와 유사한 서브밴드 실시예이다. 대체 실시예에서, TPA 처리를 위한 서브밴드는 BCC 서브밴드와 상이하다. 도 13(B)에 나타낸 바와 같이, TPA(1302)는 도 10의 TPA(1002)와 유사하게 실시될 수 있다.
도 14는 도 4의 BCC 합성기(400)에 관계된 TP 처리의 주파수 영역 적용예를 나타낸다. 디코딩 블록(1402)은 도 11의 디코딩 블록(1102)과 유사하고, 도 14(A)에 나타낸 것과 같이 각각의 TP(1404)는 도 11의 각 TP(1104)와 유사한 서브밴드 실시예이다.
도 15는 본 발명의 다른 대체 실시예에 따라, 도 2의 인코더(202)와 같은 BCC 인코더에 부가되는 주파수 영역 처리 방법에 대한 블록 다이어그램을 나타낸다. 이 방법은 다음과 같은 설정을 갖는다: 모든 입력 채널에 대한 엔벌로프 정보가 주파수에 대한 선형 예측 코딩(LPC)의 계산(1502), 파라미터화(1504), 양자화(1506), 및 인코더에 의한 비트스트림으로의 코딩(1508)에 의해 유도된다. 도 17(A)는 도 15의 TPA(1502)의 실시예를 나타낸다. 다채널 합성기(디코더)로 전송될 부수 정보는 자기상관관계법에 의해 계산된 LPC 필터 계수와, 구해진 반사 계수, 또는 선 스펙트럼 쌍 등과, 또는 부수 정보의 데이터 비율을 낮게 유지하기 위해 예를 들어 LPC 예측 이득으로부터 유도된 "과도 신호 존재/부재"의 2진 플래그와 같은 파라미터로 구성될 수 있다.
도 16은 도 4의 BCC 합성기(400)에 관계된 TP 처리의 주파수 영역 적용의 다른 예를 나타낸다. 도 15의 인코딩 처리 및 도 16의 디코딩 처리는 정합된 인코더/디코더 쌍 구성을 형성하도록 실시될 수 있다. 디코딩 블록(1602)은 도 14의 디코딩 블록(1402)과 유사하고, 각 TP(1604)는 도 14의 각 TP(1404)와 유사하다. 이 다채널 합성기에서, 전송된 TP 부수 정보는 디코딩되고 나서 개별 채널의 엔벌로프 정형을 제어하는데 사용된다. 부가적으로, 합성기는 전송된 합 신호를 분석하기 위한 엔벌로프 특징화기 단(TPA: 1606), 각 기저 신호의 시간 엔벌로프를 "평탄화"하기 위한 역 TP(ITP: 1608)를 포함하고, 여기서 엔벌로프 조정기(TP: 1604)는 각 출력 채널의 수정된 엔벌로프를 부과한다. 특정 실시예에 의하면, ITP는 업믹싱 이전 또는 이후에 적용될 수 있다. 더 구체적으로, 이는 TPA, ITP, 및 TP 처리에 대해 각각 도 17(A),(B),(C)로 나타낸 것과 같이 LPC 기반 필터를 주파수 스펙트럼에 적 용함에 의해 엔벌로프 정형을 수행하는 콘볼루션/필터링 방법을 사용하여 이루어진다. 도 16에서, 제어 블록(1610)은 엔벌로프 정형이 실시될 것인지 여부를 결정하고, 엔벌로프 정형을 할 것으로 결정했을 경우 (1) 전송된 TP 부수 정보 또는 (2) TPA(1606)에서 국부적으로 특징이 주어진 엔벌로프 데이터에 근거하여 정형을 할 것인지를 결정한다.
도 18(A) 및(B)는 도 16의 제어 블록(1610)의 2가지 동작 모드를 일예로 나타낸 것이다. 도 18(A)의 실시에 있어서, 일단의 필터 계수가 디코더로 전송되고, 콘볼루션/필터링 방법에 의한 엔벌로프 정형이 전송된 필터 계수에 근거하여 수행된다. 인코더에 의한 과도 신호 정형이 유익하지 않다고 검출되었을 경우, 어떠한 필터 데이터도 전송되지 않고 필터가 디스에이블 된다(도 18A에서 단일 필터 계수 세트 "[1,0...]"로 스위칭 되는 것으로 나타냄).
도 18(B)의 실시예에서, 각 채널에 대해 단지 하나의 "과도/비 과도 플래그"신호가 전송되고, 이 플래그는 전송된 다운믹스 신호로부터 디코더에서 계산된 필터 계수 세트에 근거하여 정형 동작을 활성 또는 비활성 시키도록 사용된다.
부가적인 대체 실시예
본 발명이 단일의 합 신호를 사용하는 BCC 코딩 방법에 관련하여 설명되었지만, 본 발명은 2개 또는 그 이상의 합 신호를 갖는 BCC 코딩 방법에 관련하여 실시될 수도 있다. 이 경우, 각 서로 다른 "기준" 합 신호가 BCC 합성을 적용하기 전에 산출될 수 있으며, 어떤 합 신호가 서로 다른 출력 채널을 합성하는데 사용되었는 가에 따라 서로 다른 시간 엔벌로프에 근거하여 서로 다른 BCC 출력 채널이 생성될 수 있다. 2개 또는 그 이상의 상이한 합 채널로부터 합성된 하나의 출력 채널은 구성하는 합 채널의 관련 효과를 고려하여(예를 들어, 가중 평균화) 하나의 유효한 시간 엔벌로프에 기반하여 생성될 수 있다.
본 발명이 ICTD, ICLD, 및 ICC 코드를 포함하는 BCC 코딩 방법에 관련하여 설명되었지만, 본 발명은 그 3가지 코드 중 하나 또는 2개의 코드(예를 들어, ICTD는 제외하고 ICLD 및 ICC) 및/또는 하나 또는 그 이상의 부가적 형태의 코드들을 포함하는 다른 BCC 코딩 방법에 관련하여 실시될 수도 있다. 더욱이, BCC 합성 처리 순서와 엔벌로프 정형 순서가 서로 다른 실시에 따라 변화할 수 있다. 예를 들어, 엔벌로프 정형이 도 14 및 도 16에서와 같이 주파수 영역 신호에 적용되는 경우, 엔벌로프 정형은 ICTD 합성 후에(ICTD 합성을 채택한 실시예에서), 그러나 ICLD 합성 전에 선택적으로 실시될 수 있다. 다른 실시예에서, 엔벌로프 정형은 다른 어떤 BCC 합성이 적용되기 전에 업믹스 신호에 적용될 수 있다.
본 발명이 원시 입력 채널로부터 엔벌로프 큐 코드를 생성하는 BCC 인코더에 관련하여 설명되었지만, 대체 실시예에서는 그 엔벌로프 큐 코드가 원시 입력 채널에 대응하는 다운믹싱된 채널로부터 생성될 수 있다. 이것은 프로세서(예를 들어, 별개의 엔벌로프 큐 코더)가 (1) 다운믹싱된 채널 및 소정의 BCC 코드(예를 들어, ICLD, ICTD, 및/또는 ICC)를 생성하는 BCC 인코더의 출력을 받아들이고, (2) 엔벌로프 큐 코드를 BCC 부수 정보에 가하기 위해 하나 또는 그 이상의 다운믹싱된 채널의 시간 엔벌로프(들)을 특징 지울 수 있게 한다.
본 발명이 다른 BCC 코드와 함께 하나 또는 그 이상의 오디오 채널(즉, E개의 전송 채널)을 통해 엔벌로프 큐 코드를 전송하는 BCC 코딩 방법에 관련하여 설명되었지만, 대체 실시예에서, 엔벌로프 큐 코드는 단독으로 또는 다른 BCC 코드와 함께, 전송된 채널 및 가능한 다른 BCC 코드를 이미 가지고 있는 장소(예를 들어, 디코더 또는 저장장치)로 전송될 수 있다.
본 발명이 BCC 코딩 방법에 관련하여 설명되었지만, 본 발명은 오디오 신호가 상관관계를 갖지 않는 다른 오디오 처리 시스템 또는 신호의 상관관계를 해제하는 것이 필요한 다른 오디오 처리에 관련하여 실시될 수 있다.
본 발명이 인코더가 시간 영역에서 오디오 신호를 수신하고 시간 영역에서 전송 오디오 신호를 생성하는 실시예와, 디코더가 시간 영역에서 전송된 오디오 신호를 수신하고 시간 영역에서 재생 오디오 신호를 생성하는 실시예에 관련하여 설명되었지만, 본 발명은 이에 국한되지 않는다. 예를 들어, 다른 실시예에서, 하나 또는 그 이상의 입력 신호, 전송 신호, 및 재생 오디오 신호가 주파수 영역에서 표현될 수 있다.
BCC 인코더 및/또는 디코더는 텔리비전 또는 전자적 음악 배포, 영화관, 방송, 스트리밍 및/또는 수신을 위한 시스템을 포함하는 다양한 서로 다른 어플리케이션 또는 시스템과 조합하여 또는 일체로 사용될 수 있다. 이것은 예를 들어, 지상파, 위성, 케이블, 인터넷, 인트라넷, 또는 물리적 매체(예를 들어, 컴팩트 디스크, 디지털 다목적 디스크, 반도체 칩, 하드 드라이브, 메모리 카드, 등)를 통한 신호 전송을 인코딩/디코딩하는 시스템을 포함한다. BCC 인코더 및/또는 디코더는 예를 들어, 오락(액션, 롤 플레잉, 전략, 모험, 시뮬레이션, 경주, 스포츠, 아케이드, 카드, 및 보드 게임)을 위해 또는 다중 머신, 플랫포옴, 미디어용으로 발행되는 교육을 위해 사용자와 상호작용하게 만들어진 대화형 소프트웨어 제품을 포함하는 게임 및 게임 시스템에 채택될 수 있다. 더욱이, BCC 인코더 및/또는 디코더는 오디오 녹음기/재생기 또는 CD-ROM/DVD 시스템에 통합될 수 있다. BCC 인코더 및/또는 디코더는 디지털 디코딩(예를 들어, 재생기, 디코더)을 포함하는 PC 소프트웨어 어플리케이션 및 디지털 인코딩 능력을 포함하는(예를 들어, 인코더, 리퍼, 리코더, 쥬크박스) 소프트웨어 어플리케이션에 통합될 수 있다.
본 발명은 단일 집적회로(ASIC 또는 FPGA와 같은), 다중 칩 모듈, 단일 카드 또는 다중 카드 회로 팩과 같은 있을 수 있는 구현을 포함하는 회로 기반 처리기로 실시될 수도 있다. 이 분야의 숙련된 기술자에게는 명백한 것이지만, 회로 구성 요소의 여러 가지 기능은 소프트웨어 프로그램에서 처리 단계로서 구현될 수 있다는 것이다. 그와 같은 소프트웨어는 예를 들어 디지털 신호 처리기, 마이크로 컨트롤러, 또는 범용 컴퓨터에서 채택될 수 있다.
본 발명이 방법의 형태와 그 방법을 실시하는 장치의 형태를 가지고 구현될 수 있지만, 본 발명은 플로피 디스켓, CD-ROM, 하드 드라이브, 또는 어떤 다른 기계 판독 가능한 기억 매체와 같은 유형의 미디어 내에 구현된 프로그램 코드의 형태로 구현될 수 있다. 본 발명은 예를 들어 기억 매체에 저장되고 기계에 의해 로딩 및/또는 실행되거나, 전기적 선로 또는 케이블 망, 광 섬유, 또는 전자기적 방사를 통하는 것과 같은 소정의 전송 매체 또는 캐리어를 통해 전송된다. 여기서, 프로그램 코드가 컴퓨터와 같은 기계에 의해 로딩되고 실행될 때, 이 기계는 본 발명을 수행하는 장치로 된다. 범용 프로세서에서 구현될 경우, 프로그램 코드 세그먼트는 프로세서와 결합하여 특정 로직 회로와 유사하게 동작하는 독특한 장치를 제공할 수 있다.
본 발명의 본질을 설명하기 위해 도시하고 설명한 부분의 세부 사항과 재료, 배치에 대해 이 분야의 숙련된 사람에게는 이하의 청구범위에서 토로한 것과 같은 본 발명의 범위를 벗어나지 않고 다양한 변경이 이루어질 수 있다.
이하의 방법 청구범위에서 처리 단계가 대응하는 부호와 함께 특정한 순서를 가지고 상술 되었지만, 청구범위의 기술 내용이 그 처리 단계의 전부 또는 일부를 실시하기 위한 특정 순서를 의미하고 있지 않은 이상, 그 처리 단계는 그 특정 순서로 실시되는 것에 국한되지 않는다.

Claims (50)

  1. 오디오 채널을 인코딩하기 위한 방법으로서,
    하나 또는 그 이상의 오디오 채널에 대해 하나 또는 그 이상의 큐 코드를 생성하는 단계, 여기서 적어도 하나의 큐 코드는 상기 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드이고, 그리고
    상기 하나 또는 그 이상의 큐 코드를 전송하는 단계를 포함하는 오디오 채널 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 하나 또는 그 이상의 오디오 채널에 대응하는 E개의(여기서, E
    Figure 112007028275678-PCT00064
    1) 전송 오디오 채널(들)을 전송하는 단계를 더 포함하는 오디오 채널 인코딩 방법.
  3. 제 2 항에 있어서,
    상기 하나 또는 그 이상의 오디오 채널은 C개의 입력 오디오 채널을 포함하고(여기서, C
    Figure 112007028275678-PCT00065
    E), 이 C개의 입력 채널은 E개의 전송 채널을 생성하도록 다운믹싱되는 것을 특징으로 하는 오디오 채널 인코딩 방법.
  4. 제 1 항에 있어서,
    상기 하나 또는 그 이상의 큐 코드는 상기 하나 또는 그 이상의 큐 코드에 근거하여 디코더가 E개 전송 채널을 디코딩할 때 엔벌로프 정형을 수행하도록 전송되고, 여기서 상기 E개 전송 채널은 상기 하나 또는 그 이상의 오디오 채널에 해당하는(여기서, E
    Figure 112007028275678-PCT00066
    1) 것을 특징으로 하는 오디오 채널 인코딩 방법.
  5. 제 4 항에 있어서,
    상기 엔벌로프 정형은 디코더에서 생성된 합성 신호의 시간 엔벌로프를 조정 하여 상기 특징 지워진 시간 엔벌로프와 정합되게 하는 것을 특징으로 하는 오디오 채널 인코딩 방법.
  6. 제 1 항에 있어서,
    상기 하나 또는 그 이상의 큐 코드는 하나 또는 그 이상의 채널간 상관관계(ICC) 코드, 채널간 레벨 차(ICLD) 코드, 및 채널간 시간 차(ICTD) 코드를 포함하는 것을 특징으로 하는 오디오 채널 인코딩 방법.
  7. 제 6 항에 있어서,
    상기 엔벌로프 큐 코드와 조합한 제 1의 시간 해상도는 기타 큐 코드에 조합된 제 2의 시간 해상도에 비해 더 미세한 것을 특징으로 하는 오디오 채널 인코딩 방법.
  8. 제 1 항에 있어서,
    상기 시간 엔벌로프는 대응하는 오디오 채널의 특정 주파수에 대해서만 특징 지워지는 것인 오디오 채널 인코딩 방법.
  9. 제 8 항에 있어서,
    상기 시간 엔벌로프는 대응하는 오디오 채널의 특정 차단 주파수 이상의 주파수에 대해서만 특징 지워지는 것인 오디오 채널 인코딩 방법.
  10. 제 1 항에 있어서,
    상기 시간 엔벌로프는 주파수 영역에서 대응하는 오디오 채널에 대해 특징 지워지는 것인 오디오 채널 인코딩 방법.
  11. 제 10 항에 있어서,
    상기 시간 엔벌로프는 대응하는 오디오 채널의 서로 다른 신호 서브밴드에 대해 개별적으로 특징 지워지는 것인 오디오 채널 인코딩 방법.
  12. 제 10 항에 있어서,
    상기 주파수 영역은 고속 푸리에 변환(FFT)에 해당하는 것을 특징으로 하는 오디오 채널 인코딩 방법.
  13. 제 10 항에 있어서,
    상기 주파수 영역은 직각 미러 필터(QMF)에 해당하는 것을 특징으로 하는 오디오 채널 인코딩 방법.
  14. 제 1 항에 있어서,
    상기 시간 엔벌로프는 시간 영역에서 대응하는 오디오 채널에 대해 특징 지워지는 것인 오디오 채널 인코딩 방법.
  15. 제 1 항에 있어서,
    상기 특징 지우는 것을 인에이블할 것인지 또는 디스에이블할 것인지를 결정하는 단계를 더 포함하는 오디오 채널 인코딩 방법.
  16. 제 15 항에 있어서,
    상기 하나 또는 그 이상의 오디오 채널에 대응하는 E개 전송 채널 (여기서, E
    Figure 112007028275678-PCT00067
    1)의 디코딩 시 엔벌로프 정형을 실시할 것인지의 여부를 디코더에 명령하는 결정에 근거하여 인에이블/디스에이블 플래그를 발생 및 전송하는 단계를 더 포함하는 오디오 채널 인코딩 방법.
  17. 제 15 항에 있어서,
    상기 결정은 과도 신호의 발생을 검출했을 때 특징 지우는 것을 인에이블시키는 것과 같이, 오디오 채널을 분석하여 오디오 채널에서의 과도 신호를 검출하는 것에 기반을 둔 것을 특징으로 하는 오디오 채널 인코딩 방법.
  18. 오디오 채널을 인코딩하기 위한 장치로서,
    하나 또는 그 이상의 오디오 채널에 대해 하나 또는 그 이상의 큐 코드를 생성하는 수단과, 그 적어도 하나의 큐 코드는 상기 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌 로프 큐 코드이고, 그리고
    하나 또는 그 이상의 큐 코드를 전송하는 수단을 포함하는 오디오 채널을 인코딩하기 위한 장치.
  19. C개 입력 오디오채널을 인코딩하고 E개 전송 오디오채널을 생성하기 위한 장치로서, 이 장치가:
    적어도 하나의 C 입력 채널의 입력 시간 엔벌로프를 특징 지우는 엔벌로프 분석기와,
    2개 또는 그 이상의 C 입력 채널에 대한 큐 코드를 생성하는 코드 추정기와, 그리고
    E 개의 전송 채널을 생성하도록 C 입력 채널을 다운믹스하는 다운믹서 (여기서, E
    Figure 112007028275678-PCT00068
    1)를 포함하고,
    상기 장치는 디코더가 E개의 전송 채널을 디코딩할 때 합성 및 엔벌로프 정형을 수행할 수 있도록 큐 코드 및 특징 지워진 입력 시간 엔벌로프에 관한 정보를 전송하는 것을 특징으로 하는 장치.
  20. 제 19 항에 있어서,
    상기 장치는 디지털 녹화기, 디지털 녹음기, 컴퓨터, 위성 송신기, 유선 송신기, 지상파 방송 송신기, 가정 오락 시스템, 및 무비 시어터 시스템으로 구성된 그룹에서 선택된 어느 하나의 시스템이며, 그리고
    상기 시스템은 엔벌로프 분석기, 코드 추정기, 및 다운믹서를 포함하는 것을 특징으로 하는 장치.
  21. 인코딩된 프로그램 코드를 갖는 기계판독 가능한 매체로서,
    상기 프로그램 코드가 기계에 의해 실행될 때, 상기 기계는 오디오 채널을 인코딩하는 방법을 실시하고,
    상기 방법은:
    하나 또는 그 이상의 오디오 채널에 대해 하나 또는 그 이상의 큐 코드를 생성하고, 그 적어도 하나의 큐 코드는 상기 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드이고, 그리고
    하나 또는 그 이상의 큐 코드를 전송하는 것을 포함하는 인코딩된 프로그램 코드를 갖는 기계판독 가능한 매체.
  22. 오디오 채널을 인코딩하여 생성된 인코딩된 오디오 비트스트림으로서,
    하나 또는 그 이상의 오디오 채널에 대해 하나 또는 그 이상의 큐 코드가 생성되고, 그 적어도 하나의 큐 코드는 상기 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드이며, 그리고
    하나 또는 그 이상의 오디오 채널에 대응하는 상기 하나 또는 그 이상의 큐 코드 및 E개의 전송 오디오 채널은 인코딩된 오디오 비트스트림으로 인코딩(여기서, E
    Figure 112007028275678-PCT00069
    1) 되는 것을 특징으로 하는 인코딩된 오디오 비트스트림
  23. 하나 또는 그 이상의 큐 코드 및 E개의 전송 오디오 채널을 포함하는 인코딩된 오디오 비트스트림으로서,
    상기 하나 또는 그 이상의 큐 코드가 하나 또는 그 이상의 오디오 채널에 대해 생성되고, 그 적어도 하나의 큐 코드는 상기 하나 또는 그 이상의 오디오 채널 중 하나의 오디오 채널의 시간 엔벌로프를 특징 지우는 것에 의해 생성된 엔벌로프 큐 코드이며, 그리고
    상기 E개의 전송 오디오 채널은 상기 하나 또는 그 이상의 오디오 채널에 해당하는 것을 특징으로 하는 인코딩된 오디오 비트스트림.
  24. E개의 전송 오디오 채널을 디코딩하여 C개의 재생 오디오 채널로 생성하는 방법으로서, 여기서 C
    Figure 112007028275678-PCT00070
    E
    Figure 112007028275678-PCT00071
    1이며, 상기 방법은:
    E개의 전송 오디오 채널에 대응하는 큐 코드를 수신하고, 그 큐 코드는 E개의 전송 오디오 채널에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함하고;
    하나 또는 그 이상의 업믹싱된 채널을 생성하도록 하나 또는 그 이상의 E개의 전송 오디오 채널을 업믹싱하고; 그리고
    상기 하나 또는 그 이상의 업믹싱된 채널에 큐 코드를 가하는 것에 의해 하 나 또는 그 이상의 C 재생 채널을 합성하는 것으로 이루어지고; 상기 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프와 실질적으로 정합되게 하는 것을 특징으로 하는 방법.
  25. 제 24 항에 있어서,
    상기 엔벌로프 큐 코드는 E개 전송 채널을 생성하도록 사용된 원래 입력 채널의 특징 지워진 시간 엔벌로프에 해당하는 것을 특징으로 하는 방법.
  26. 제 24 항에 있어서,
    상기 큐 코드는 하나 또는 그 이상의 ICC, ICLD, 및 ICTD 코드를 더 포함하는 것을 특징으로 하는 방법.
  27. 제 26 항에 있어서,
    상기 엔벌로프 큐 코드와 조합한 제 1의 시간 해상도는 기타 큐 코드에 조합된 제 2의 시간 해상도에 비해 더 미세한 것을 특징으로 하는 방법.
  28. 제 26 항에 있어서,
    상기 합성은 지연-잔향 ICC 합성 방법을 포함하는 것을 특징으로 하는 방법.
  29. 제 26 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프는 ICLD 합성 전에 조정되는 것을 특징으로 하는 방법.
  30. 제 24 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프가 특징 지워지고, 그리고
    상기 합성된 신호의 시간 엔벌로프는 엔벌로프 큐 코드에 대응하는 특징 지워진 시간 엔벌로프 및 합성된 신호의 특징 지워진 시간 엔벌로프 양자에 근거하여 조정되는 방법.
  31. 제 30 항에 있어서,
    상기 엔벌로프 큐 코드에 대응하는 특징 지워진 시간 엔벌로프 및 합성된 신호의 특징 지워진 시간 엔벌로프에 근거하여 스케일링 함수가 생성되고, 그리고
    상기 스케일링 함수가 합성된 신호에 가해지는 것을 특징으로 하는 방법.
  32. 제 24 항에 있어서,
    평탄화된 채널을 생성하도록 특징 지워진 시간 엔벌로프에 근거하여 전송된 채널을 조정하는 단계를 더 포함하고, 상기 평탄화된 채널에 업믹싱 및 합성을 가하여 대응하는 재생 채널을 생성하는 것을 특징으로 하는 방법.
  33. 제 24 항에 있어서,
    평탄화된 채널을 생성하도록 특징 지워진 시간 엔벌로프에 근거하여 업믹싱된 채널을 조정하는 단계를 더 포함하고, 상기 평탄화된 채널에 합성을 가하여 대응하는 재생 채널을 생성하는 것을 특징으로 하는 방법.
  34. 제 24 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프는 단지 특정 주파수에 대해 조정되는 것을 특징으로 하는 방법.
  35. 제 34 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프는 특정 차단 주파수 이상의 주파수에 대해서만 조정되는 것을 특징으로 하는 방법.
  36. 제 24 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프는 주파수 영역에서 조정되는 것을 특징으로 하는 방법.
  37. 제 36 항에 있어서,
    상기 시간 엔벌로프는 합성된 신호에서 서로 다른 신호 서브밴드에 대해 개별적으로 조정되는 것을 특징으로 하는 방법.
  38. 제 36 항에 있어서,
    상기 주파수 영역은 FFT에 해당하는 것을 특징으로 하는 방법.
  39. 제 36 항에 있어서,
    상기 주파수 영역은 QMF에 해당하는 것을 특징으로 하는 방법.
  40. 제 24 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프는 시간 영역에서 조정되는 것을 특징으로 하는 방법.
  41. 제 24 항에 있어서,
    상기 합성된 신호의 시간 엔벌로프를 조정하는 것을 인에이블 시킬 것인지 또는 디스에이블 시킬 것인지 여부를 결정하는 단계를 더 포함하는 방법.
  42. 제 41 항에 있어서,
    상기 결정 단계는 E 전송 채널을 생성하는 오디오 인코더에 의해 발생한 인에이블/디스에이블 플래그에 기반을 두는 것을 특징으로 하는 방법.
  43. 제 41 항에 있어서,
    상기 결정 단계는 과도 신호의 발생을 검출했을 때 조정을 인에이블 시키는 것과 같이 E개의 전송 채널을 분석하여 과도 신호를 검출하는 것에 기반을 둔 것을 특징으로 하는 방법.
  44. 제 24 항에 있어서,
    전송된 채널의 시간 엔벌로프를 특징 지우고, 그리고
    (1) 엔벌로프 큐 코드에 대응하는 특징 지워진 시간 엔벌로프 또는 (2) 합성된 신호의 시간 엔벌로프를 조정하기 위해 전송된 채널의 특징 지워진 시간 엔벌로프를 사용할 것인지를 결정하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  45. 제 24 항에 있어서,
    상기 시간 엔벌로프를 조정한 후 합성된 신호의 특정 윈도우 내의 출력이 상기 조정 이전의 합성된 신호의 대응 윈도우 내의 출력과 동일한 것을 특징으로 하는 방법.
  46. 제 45 항에 있어서,
    상기 특정 윈도우는 하나 또는 그 이상의 비-엔빌로프 큐 코드와 조합된 합성 윈도우에 해당하는 것을 특징으로 하는 방법.
  47. E개의 전송 오디오 채널을 디코딩하여 C개의 재생 오디오 채널을 생성하는 장치로서, 여기서 C
    Figure 112007028275678-PCT00072
    E
    Figure 112007028275678-PCT00073
    1이며, 상기 장치는:
    E개의 전송 오디오 채널에 대응하는 큐 코드를 수신하는 수단과, 이 큐 코드는 E개의 전송 오디오 채널에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함하고;
    하나 또는 그 이상의 업믹싱된 채널을 생성하도록 하나 또는 그 이상의 E개의 전송 오디오 채널을 업믹싱하는 수단과; 그리고
    상기 하나 또는 그 이상의 업믹싱된 채널에 큐 코드를 가하는 것에 의해 하나 또는 그 이상의 C 재생 채널을 합성하는 수단을 포함하고; 상기 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프와 정합되게 하는 것을 특징으로 하는 장치.
  48. E개의 전송 오디오 채널을 디코딩하여 C개의 재생 오디오 채널을 생성하는 장치로서, 여기서 C
    Figure 112007028275678-PCT00074
    E
    Figure 112007028275678-PCT00075
    1이며, 상기 장치는:
    E개의 전송 오디오 채널에 대응하는 큐 코드를 수신하는 수신기와, 이 큐 코드는 E개의 전송 오디오 채널에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함하고;
    하나 또는 그 이상의 업믹싱된 채널을 생성하도록 하나 또는 그 이상의 E개의 전송 오디오 채널을 업믹싱하는 업믹서와; 그리고
    상기 하나 또는 그 이상의 업믹싱된 채널에 큐 코드를 가하는 것에 의해 하 나 또는 그 이상의 C 재생 채널을 합성하는 합성기를 포함하고; 상기 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프와 정합되게 하는 것을 특징으로 하는 장치.
  49. 제 48 항에 있어서,
    상기 장치는 디지털 녹화기, 디지털 녹음기, 컴퓨터, 위성 수신기, 유선 수신기, 지상파 방송 수신기, 가정 오락 시스템, 및 무비 시어터 시스템으로 구성된 그룹에서 선택된 어느 하나의 시스템이며, 그리고
    상기 시스템은 수신기, 업믹서, 합성기, 및 엔벌로프 조정기를 포함하는 장치.
  50. 인코딩된 프로그램 코드를 갖는 기계판독 가능한 매체로서,
    상기 프로그램 코드가 기계에 의해 실행될 때, 상기 기계는 E개의 전송 오디오 채널을 디코딩하고 C개 재생 오디오 채널을 생성하는 방법을 실시하고,여기서 C
    Figure 112007028275678-PCT00076
    E
    Figure 112007028275678-PCT00077
    1이며, 이 방법은:
    E개의 전송 오디오 채널에 대응하는 큐 코드를 수신하고, 그 큐 코드는 E개의 전송 오디오 채널에 대응하는 오디오 채널의 특징 지워진 시간 엔벌로프에 대응하는 엔벌로프 큐 코드를 포함하고;
    하나 또는 그 이상의 업믹싱된 채널을 생성하도록 하나 또는 그 이상의 E개 의 전송 오디오 채널을 업믹싱하고; 그리고
    상기 하나 또는 그 이상의 업믹싱된 채널에 큐 코드를 가하는 것에 의해 하나 또는 그 이상의 C 재생 채널을 합성하고; 상기 엔벌로프 큐 코드는 업믹싱된 채널 또는 합성된 신호에 가해지고, 합성된 신호의 시간 엔벌로프를 특징 지워진 시간 엔벌로프에 근거하여 조정함에 있어 조정된 시간 엔벌로프가 특징 지워진 시간 엔벌로프와 정합되게 하는 것을 특징으로 하는 기계판독 가능한 매체.
KR1020077008410A 2004-10-20 2005-09-07 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형 KR100924576B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US62048004P 2004-10-20 2004-10-20
US60/620,480 2004-10-20
US11/006,482 2004-12-07
US11/006,482 US7720230B2 (en) 2004-10-20 2004-12-07 Individual channel shaping for BCC schemes and the like

Publications (2)

Publication Number Publication Date
KR20070061872A true KR20070061872A (ko) 2007-06-14
KR100924576B1 KR100924576B1 (ko) 2009-11-02

Family

ID=36180779

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077008410A KR100924576B1 (ko) 2004-10-20 2005-09-07 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형

Country Status (21)

Country Link
US (1) US7720230B2 (ko)
EP (1) EP1803117B1 (ko)
JP (1) JP4664371B2 (ko)
KR (1) KR100924576B1 (ko)
CN (1) CN101044551B (ko)
AT (1) ATE424606T1 (ko)
AU (1) AU2005299068B2 (ko)
BR (1) BRPI0516405B1 (ko)
CA (1) CA2582485C (ko)
DE (1) DE602005013103D1 (ko)
DK (1) DK1803117T3 (ko)
ES (1) ES2323275T3 (ko)
HK (1) HK1106861A1 (ko)
IL (1) IL182236A (ko)
MX (1) MX2007004726A (ko)
NO (1) NO338919B1 (ko)
PL (1) PL1803117T3 (ko)
PT (1) PT1803117E (ko)
RU (1) RU2339088C1 (ko)
TW (1) TWI318079B (ko)
WO (1) WO2006045371A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8542839B2 (en) 2008-10-23 2013-09-24 Samsung Electronics Co., Ltd. Audio processing apparatus and method of mobile device
KR20140140102A (ko) * 2012-04-05 2014-12-08 후아웨이 테크놀러지 컴퍼니 리미티드 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
KR100682915B1 (ko) * 2005-01-13 2007-02-15 삼성전자주식회사 다채널 신호 부호화/복호화 방법 및 장치
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
JP5457171B2 (ja) * 2006-03-20 2014-04-02 オランジュ オーディオデコーダ内で信号を後処理する方法
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
CA2670864C (en) 2006-12-07 2015-09-29 Lg Electronics Inc. A method and an apparatus for processing an audio signal
FR2911426A1 (fr) * 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
PL2118889T3 (pl) 2007-03-05 2013-03-29 Ericsson Telefon Ab L M Sposób i sterownik do wygładzania stacjonarnego szumu tła
CA2705968C (en) * 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2248289A1 (en) * 2008-02-29 2010-11-10 Telefonaktiebolaget L M Ericsson (publ) Channel power estimation means
WO2009125046A1 (en) * 2008-04-11 2009-10-15 Nokia Corporation Processing of signals
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
EP2491551B1 (en) * 2009-10-20 2015-01-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
EP3422346B1 (en) 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
CN103339670B (zh) * 2011-02-03 2015-09-09 瑞典爱立信有限公司 确定多通道音频信号的通道间时间差
RU2628195C2 (ru) 2012-08-03 2017-08-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер и способ параметрической концепции обобщенного пространственного кодирования аудиообъектов для случаев многоканального понижающего микширования/повышающего микширования
CN105393304B (zh) * 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
WO2015041477A1 (ko) 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10204630B2 (en) 2013-10-22 2019-02-12 Electronics And Telecommunications Research Instit Ute Method for generating filter for audio signal and parameterizing device therefor
BR112016014892B1 (pt) 2013-12-23 2022-05-03 Gcoa Co., Ltd. Método e aparelho para processamento de sinal de áudio
EP4294055A1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
CN108966111B (zh) 2014-04-02 2021-10-26 韦勒斯标准与技术协会公司 音频信号处理方法和装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI587286B (zh) * 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
JP6797187B2 (ja) 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法
ES2771200T3 (es) 2016-02-17 2020-07-06 Fraunhofer Ges Forschung Postprocesador, preprocesador, codificador de audio, decodificador de audio y métodos relacionados para mejorar el procesamiento de transitorios
CN107818790B (zh) * 2017-11-16 2020-08-11 苏州麦迪斯顿医疗科技股份有限公司 一种多路音频混音方法及装置
RU2762302C1 (ru) * 2018-04-05 2021-12-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ или компьютерная программа для оценки разности во времени между каналами
GB2584630A (en) * 2019-05-29 2020-12-16 Nokia Technologies Oy Audio processing

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4236039A (en) 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
US4815132A (en) 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3943881B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5371799A (en) 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3227942B2 (ja) 1993-10-26 2001-11-12 ソニー株式会社 高能率符号化装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277679B2 (ja) 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US7012630B2 (en) 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
ATE309644T1 (de) 1996-02-08 2005-11-15 Koninkl Philips Electronics Nv Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
US5825776A (en) 1996-02-27 1998-10-20 Ericsson Inc. Circuitry and method for transmitting voice and data signals upon a wireless communication channel
US5889843A (en) 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SG54383A1 (en) 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6111958A (en) 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US5860060A (en) 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment
US6108584A (en) 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6021389A (en) 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
TW444511B (en) 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000152399A (ja) 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6408327B1 (en) 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6282631B1 (en) 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4438127B2 (ja) 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US6823018B1 (en) 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US6434191B1 (en) 1999-09-30 2002-08-13 Telcordia Technologies, Inc. Adaptive layered coding for voice over wireless IP applications
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6614936B1 (en) 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6498852B2 (en) 1999-12-07 2002-12-24 Anthony Grimani Automatic LFE audio signal derivation system
US6845163B1 (en) 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US6782366B1 (en) 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US6850496B1 (en) 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6973184B1 (en) 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7236838B2 (en) 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
TW510144B (en) 2000-12-27 2002-11-11 C Media Electronics Inc Method and structure to output four-channel analog signal using two channel audio hardware
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7668317B2 (en) 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
KR20040080003A (ko) 2002-02-18 2004-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 오디오 코딩
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
WO2003094369A2 (en) 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
US6940540B2 (en) 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
JP4322207B2 (ja) 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7516066B2 (en) * 2002-07-16 2009-04-07 Koninklijke Philips Electronics N.V. Audio coding
ATE348386T1 (de) 2002-11-28 2007-01-15 Koninkl Philips Electronics Nv Audiosignalkodierung
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
KR20050116828A (ko) 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US20050069143A1 (en) 2003-09-30 2005-03-31 Budnikov Dmitry N. Filtering for spatial audio rendering
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8542839B2 (en) 2008-10-23 2013-09-24 Samsung Electronics Co., Ltd. Audio processing apparatus and method of mobile device
KR20140140102A (ko) * 2012-04-05 2014-12-08 후아웨이 테크놀러지 컴퍼니 리미티드 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법
US9449603B2 (en) 2012-04-05 2016-09-20 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal

Also Published As

Publication number Publication date
HK1106861A1 (en) 2008-03-20
NO20071493L (no) 2007-05-22
PT1803117E (pt) 2009-06-15
RU2339088C1 (ru) 2008-11-20
AU2005299068B2 (en) 2008-10-30
MX2007004726A (es) 2007-09-07
IL182236A (en) 2011-08-31
DK1803117T3 (da) 2009-06-22
ATE424606T1 (de) 2009-03-15
BRPI0516405A (pt) 2008-09-02
DE602005013103D1 (de) 2009-04-16
NO338919B1 (no) 2016-10-31
CN101044551A (zh) 2007-09-26
TW200628001A (en) 2006-08-01
US20060083385A1 (en) 2006-04-20
CA2582485A1 (en) 2006-05-04
BRPI0516405B1 (pt) 2019-09-17
WO2006045371A1 (en) 2006-05-04
JP2008517333A (ja) 2008-05-22
ES2323275T3 (es) 2009-07-10
JP4664371B2 (ja) 2011-04-06
BRPI0516405A8 (pt) 2018-07-31
US7720230B2 (en) 2010-05-18
EP1803117B1 (en) 2009-03-04
PL1803117T3 (pl) 2009-08-31
KR100924576B1 (ko) 2009-11-02
CA2582485C (en) 2012-05-15
EP1803117A1 (en) 2007-07-04
AU2005299068A1 (en) 2006-05-04
IL182236A0 (en) 2007-09-20
CN101044551B (zh) 2012-02-08
TWI318079B (en) 2009-12-01

Similar Documents

Publication Publication Date Title
KR100924576B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형
KR100922419B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 확산음 엔벌로프 정형
KR100895609B1 (ko) 공간 오디오의 파라메트릭 코딩을 위한 조밀한 부수 정보
JP5017121B2 (ja) 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
JP5106115B2 (ja) オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121005

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131001

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141001

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151001

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160929

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20181004

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 11