KR101445291B1 - 결합 유닛 및 믹서를 사용하여 트랜지언트들을 포함하는 신호를 디코딩하기 위한 장치 - Google Patents
결합 유닛 및 믹서를 사용하여 트랜지언트들을 포함하는 신호를 디코딩하기 위한 장치 Download PDFInfo
- Publication number
- KR101445291B1 KR101445291B1 KR1020137007136A KR20137007136A KR101445291B1 KR 101445291 B1 KR101445291 B1 KR 101445291B1 KR 1020137007136 A KR1020137007136 A KR 1020137007136A KR 20137007136 A KR20137007136 A KR 20137007136A KR 101445291 B1 KR101445291 B1 KR 101445291B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- transient
- decorrelator
- mixer
- signals
- Prior art date
Links
- 230000001052 transient effect Effects 0.000 claims abstract description 304
- 238000000034 method Methods 0.000 claims description 87
- 238000000926 separation method Methods 0.000 claims description 49
- 238000002156 mixing Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000002596 correlated effect Effects 0.000 claims description 6
- 230000002463 transducing effect Effects 0.000 claims 1
- 230000008878 coupling Effects 0.000 abstract description 7
- 238000010168 coupling process Methods 0.000 abstract description 7
- 238000005859 coupling reaction Methods 0.000 abstract description 7
- 238000012545 processing Methods 0.000 description 55
- 238000013507 mapping Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 13
- 238000001514 detection method Methods 0.000 description 11
- 230000002123 temporal effect Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 238000004091 panning Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 238000003672 processing method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
- Error Detection And Correction (AREA)
- Optical Communication System (AREA)
Abstract
역상관된 신호를 발생시키기 위한 장치는 트랜지언트 분리기(310; 410; 510; 610; 710; 910), 트랜지언트 역상관기(320; 420; 520; 620; 720; 920), 제 2 역상관기(330; 430; 530; 630; 730; 930), 결합 유닛(340; 440; 540; 640; 740; 940) 및 믹서(450; 552; 752; 952)를 포함하는데, 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 제 1 신호 성분이 입력 신호의 트랜지언트 신호 부들을 포함하고 제 2 신호 성분이 입력 신호의 비-트랜지언트 신호 부들을 포함하는 것과 같이 입력 신호를 제 1 신호 성분 및 제 2 신호 성분으로 분리하도록 구성된다. 결합 유닛(340; 440; 540; 640; 740; 940) 및 믹서(450; 552; 752; 952)는 결합 유닛으로부터 역상관된 신호가 입력 신호로서 믹서(450; 552; 752; 952) 내로 제공되도록 배치된다.
Description
본 발명은 오디오 처리 및 오디오 디코딩에 관한 것으로서, 특히 트랜지언트(transient)를 포함하는 신호의 디코딩에 관한 것이다.
오디오 처리 및/또는 디코딩은 많은 방법으로 개량되어 왔다. 특히, 공간적(spatial) 오디오 적용들은 더욱 더 중요하게 되었다. 오디오 신호 처리는 때때로 신호들을 역상관시키거나(decorrelate) 또는 렌더(render)하기 위하여 사용된다. 게다가, 신호들의 역상관 및 렌더링(rendering)은 모노-대-스테레오 업믹스(mono-to-stereo upmix), 모노/스테레오에서 다중-채널로의 업믹스, 인공 잔향(artificial reverberation), 스테레오 확장(stereo widening), 또는 사용자 상호작용(interactive) 믹싱/렌더링에서 사용된다.
일부 오디오 신호 처리 시스템들은 역상관기(decorrelator)들을 사용한다. 중요한 예가 하나 또는 몇몇의 다운믹스 신호들로부터 재구성되는 두 개 또는 그 이상의 신호들 사이의 특정 역상관 특성들을 복원하기 위하여 파라미터의 공간적 오디오 디코더에서의 역상관 시스템들의 적용이다. 역상관기들의 적용은 예를 들면, 음압(intensity) 스테레오와 비교하여 출력 신호의 지각 품질을 상당히 향상시킨다. 구체적으로, 역상관기들의 사용은 광범위한 음향 이미지, 일부 동시발생(concurrent) 음향 객체들 및/또는 앰비언스(ambience)의 적절한 합성을 가능하게 한다. 그러나, 역상관기들은 또한 시간적 신호 구조, 음색(timbre) 등에서의 변화와 같은 아티팩트(artifact)들을 도입하는 것으로 알려진다.
오디오 처리에서의 역상관기들의 다른 적용 예들은 예를 들면, 수렴 특성(convergence behavior)을 향상시키기 위하여 다중채널 음향 반향 제거 시스템들에서 공간적 효과 또는 역상관기의 사용을 변경하기 위한 인공 잔향의 발생이다.
예를 들면, 파라메트릭 스테레오(Parametric Sereo, PS)에 적용되는, 모노에서 스테레오로의 업믹서(up-mixer)에서 역상관기의 기술 적용의 일반적인 상태가 도 1에 도시되는데, 모노 입력 신호(M, "원래의(dry)" 신호)가 역상관기(110)에 적용된다. 역상관기(110)는 그것의 입력에서 역상관된 신호(D, "가공된(wet)" 신호)를 제공하기 위하여 역상관 방법에 따라 모노 입력 신호(M)를 역상관시킨다. 역상관된 신호(D)는 제 2 믹서 입력 신호로서의 원래의 모노 신호(M)와 함께 제 1 입력 믹서 신호로서 믹서(mixer, 120) 내로 제공된다. 게다가, 업-믹스 제어 유닛(130)은 업-믹스 제어 파라미터들을 믹서(120) 내로 제공한다. 믹서(120)는 그리고 나서 믹싱 매트릭스(H)에 따라 두 개의 출력 채널 L 및 R(L=왼쪽 스테레오 출력 채널; R=오른쪽 스테레오 출력 채널)을 발생시킨다. 믹싱 매트릭스의 계수는 고정될 수 있거나, 신호 의존형일 수 있거나, 또는 사용자에 의해 제어될 수 있다.
대안으로서, 믹싱 매트릭스는 원하는 다중-채널 출력을 형성하기 위하여 다운믹스의 신호들을 어떻게 업믹스하는가에 대한 파라미터 설명을 포함하는 다운믹스와 함께 전송되는 부가 정보에 의해 제어된다. 이러한 공간적 부가 정보는 대체로 일치하는 신호 인코더 내의 모노 다운믹스 과정 동안에 발생된다.
이러한 원리는 공간적 오디오 코딩에서 광범위하게 적용되는데, 예를 들면, J. Breebaart, S. van De Par, A Kohlrausch, E. Schuijers의 "High-Qaulity Parametric Spatial Audio Coding at Low Bitrates", Proceedings of the AES 116th Convention, Berlin, Preprint 6072, May 2004이 참조된다.
파라메트릭 스테레오 디코더의 기술 구조의 또 다른 일반적인 상태가 도 2에 도시되는데, 변환 도메인(transform domain)에서 역상관 과정이 실행된다. 분석 필터뱅크(analysis filterbank, 210)는 모노 입력 신호를 변환 도메인, 예를 들면 주파수 도메인으로 변환한다. 변환된 모노 입력 신호(M)의 역상관은 그리고 나서 역상관된 신호(D)를 발생시키는 역상관기(220)에 의해 실행된다. 변환된 모노 입력 신호(M) 및 역상관된 신호(D) 모두 믹싱 매트릭스(mixing matrix, 230) 내로 제공된다. 믹싱 매트릭스(230)는 그리고 나서 공간적 파라미터들을 제공하고 파라미터 제어 유닛(250)과 결합되는, 파라미터 변형 유닛(parameter modification unit, 240)에 의해 제공되는, 업-믹스 파라미터들을 고려하는 두 개의 출력 신호(L 및 R)를 발생시킨다. 도 2에서, 공간적 파라미터들은 사용자 또는 부가적 툴(tool), 예를 들면, 바이노럴(binaural) 렌더링/표현을 위한 후-처리에 의해 변형될 수 있다. 이러한 실시 예에서, 업-믹스 파라미터들은 업-믹스 매트릭스를 위한 입력 파라미터들을 형성하기 위하여 바이노럴 필터들로부터 파라미터들과 함께 결합된다. 마지막으로, 믹싱 매트릭스(230)에 의해 발생된 출력 신호들이 스테레오 출력 신호를 결정하는, 합성 필터뱅크 내로 제공된다.
믹싱 매트릭스(230)의 출력(L/R)은 예를 들면, 다음의 방정식을 적용함으로써 믹싱 룰(mixing rule)에 따라 모노 입력 신호(D) 및 역상관된 신호(D)로부터 계산된다:
믹싱 매트릭스에서, 출력으로 제공된 역상관된 음향의 양은 전송된 파라미터들, 예를 들면, 채널간 상관관계(inter-channel correlation)/간섭성(coherence) 및/또는 고정되거나 사용자-정의된 설정들을 기초로 하여 제어된다.
개념상으로, 역상관기 출력(D)의 출력 신호는 원래의 L/R 신호들의 완전한 디코딩을 이상적으로 허용할 수 있는 잔여 신호(residual signal)를 대체한다. 업믹서에서의 잔여 신호 대신에 역상관기 출력(D)의 사용은 그렇지 않으면 잔여 신호를 전송하기 위하여 필요하였을 수 있는 비트 레이트의 절약을 야기한다. 역상관기의 목적은 따라서 신호(D)에 의해 대체되는 잔여 신호와 유사한 특성을 나타내는, 모노 신호(M)로부터 신호(D)를 발생시키는 것이다.
상응하게, 인코더 면 상에서, 두 가지 형태의 공간적 파라미터들이 추출된다. 파라미터들의 첫 번째 그룹은 인코딩되어야 하는 두 개의 입력 채널들 사이의 간섭성 또는 교차 상관관계를 표현하는 상관관계/간섭성 파라미터들(예를 들면, 채널간 상관관계/간섭성 파라미터들)을 포함한다. 파라미터들의 두 번째 그룹은 두 개의 입력 채널들 사이의 레벨 차이를 표현하는 레벨 차이 파라미터들(예를 들면, 채널간 레벨 차이 파라미터들)을 포함한다.
게다가, 다운믹스 신호는 두 개의 입력 채널의 다운믹싱에 의해 발생된다. 게다가 잔여 신호가 발생된다. 잔여 신호들은 부가적으로 다운믹스 신호 및 업믹스 매트릭스를 사용함으로써 원래의 신호들을 재발생시키기 위하여 사용될 수 있는 신호들이다. 예를 들면, N개의 신호들이 1개의 신호로 다운믹스되면, 다운믹스는 일반적으로 N 입력 신호들의 매핑으로부터 야기하는 N 성분의 1이다. 매핑으로부터 야기하는 나머지 성분들(예를 들면, N-1 성분들)은 잔여 신호들이며 역 매핑에 의해 원래의 N 신호들의 재구성을 허용한다. 매핑은 예를 들면, 회전(rotation)일 수 있다. 매핑은 다운믹스 신호가 최대화되고 잔여 신호들이 최소화되는, 예를 들면, 원래의 축 변환과 유사한 것과 같이 수행되어야만 한다. 예를 들면, 다운믹스 신호의 에너지는 최대화되어야만 하고 잔여 신호들의 에너지는 최소화되어야만 한다. 두 개의 신호를 하나의 신호로 다운믹스할 때, 다운믹스는 정상적으로 두 개의 입력 신호의 매핑으로부터 야기하는 두 개의 성분 중의 하나이다. 매핑으로부터 야기하는 나머지 성분은 잔여 신호이며 역 매핑에 의해 원래의 두 개의 신호의 재구성을 허용한다.
일부 경우에 있어서, 잔여 신호는 그것들의 다운믹스 및 관련 파라미터들에 의한 두 개의 신호의 표현과 관련된 에러(error)를 표현할 수 있다. 예를 들면, 잔여 신호는 원래의 채널들(L 및 R) 및 원래의 채널들(L 및 R)을 기초로 하여 발생된 다운믹스 신호의 업믹스로부터 기인하는, 채널들(L' 및 R') 사이의 에러를 표현하는 에러 신호일 수 있다.
바꾸어 말하면, 잔여 신호는 다운 믹스 신호와 함께 또는 다운믹스 신호 및 파라메트릭 정보와 함께 원래의 채널의 정확하거나 또는 거의 정확한 재구성을 허용하는, 시간 도메인 또는 주파수 도메인 내의 신호로서 고려될 수 있다. 거의 정확한이란 용어는 제로보다 큰 에너지를 갖는 잔여 신호로의 재구성이 잔여 신호 없이 다운믹스를 사용하거나 또는 잔여 신호 없이 다운믹스 및 파라메트릭 정보를 사용하는 재구성과 비교하여 원래의 채널에 더 가까운 것으로 이해되어야 한다.
MPEG 서라운드를 고려하면, 1-대-2 박스(One-To-Two box)들로 불리는 파라메트릭 스테레오와 유사한 구조들이 공간적 오디오 코딩 트리(tree)들에서 사용된다. 이는 다중채널 공간적 오디오 코딩/디코딩 방법들에 대한 모노-대-스테레오 업믹스의 개념의 일반화로서 알 수 있다. MPEG 서라운드에서, 2-대-3 운용 모드에 따라 역상관기들을 적용할 수 있는 2-대-3 업믹스 시스템들이 또한 존재한다. 상세한 내용이 J. Herre, K. Kjorling, J. Breebart 등의 "MPEG Surround- the ISO/MPEG standard for efficient and compatible multi-channel audio coding", Proceedings of the 122th AES Convention, Vienna, Austria, May 2007에서 설명된다.
방향성(directional) 오디오 코딩과 관련하여, 방향성 오디오 코딩은 고정된 확성기(loudspeaker) 위치들을 갖는 고정된 수의 오디오 출력 채널들에 제한받지 않는 파라메트릭 음장(sound field) 코딩 방법에 관한 것이다. 방향성 오디오 코딩은 음장들의 비-간섭성 성분들을 합성하기 위하여 방향성 오디오 코딩 렌더러(renderer), 즉, 공간적 오디오 디코더에서 역상관기를 적용한다. 방향성 오디오 코딩에 이르게 하는 더 많은 정보는 Pulkki, Ville의 "Spatial Sound Reproduction with Directional Audio Coding", J. Audio Eng. Soc., Vol. 55. No. 7, 2007에서 찾을 수 있다.
공간적 오디오 디코더들에서의 최신 역상관기들과 관련하여, ISO/IEC International Standard "Information Technology- MPEG audio technologies- Part1: MPEG Surround", ISO/IEC 23003-1:2007 및 또한 J. Engdegard, H. Punnhagen, J. Roden, L. Liljervd의 "Synthetic Ambience in Parametric Stereo coding", Proceedings of the AES 116th Convention, Berlin, Preprint, May, 2004가 참조된다. 무한 임펄스 응답(IIR) 격자 전역통과(allpass) 구조들은 J. Herre, K. Kjorling, J. Breebart 등의 "MPEG Surround- the ISO/MPEG standard for efficient and compatible multi-channel audio coding", Proceedings of the 122th AES Convention, Vienna, Austria, May 2007에서 설명된 것과 같이, 그리고 ISO/IEC International Standard "Information Technology- MPEG audio technologies- Part1: MPEG Surround", ISO/IEC 23003-1:2007에서 설명된 것과 같이, MPEG 서라운드와 같은 공간적 오디오 디코더들에서의 역상관기들로서 사용된다. 다른 최신 역상관기들은 신호들을 역상관시키거나 또는 예를 들면 잠재적으로 감쇠하는 잡음 버스트(noise burst)들을 갖는 입력 신호들을 감기 위한 (잠재적으로 주파수 의존적) 지연들에 적용된다. 공간적 오디오 업믹스 시스템들을 위한 최신 역상관기들의 개요를 위하여, "Synthetic Ambience in Parametric Stereo coding", Proceedings of the AES 116th Convention, Berlin, Preprint, May, 2004가 참조된다.
신호들을 처리하는 또 다른 기술은 "의미론적(semantic) 업믹스 처리"이다. 의미론적 업믹스 처리는 신호들을 서로 다른 의미론적 특성들을 갖는 성분들로 분해하고 서로 다른 업믹스 전략들을 서로 다른 성분들에 적용하는 기술이다. 전체 신호 처리 방법을 향상시키기 위하여 서로 다른 업믹스 알고리즘들이 서로 다른 의미론적 특성들에 따라 최적화될 수 있다. 이러한 개념은 국제특허 WO/2010/017967에서 설명된다.
또 다른 공간적 오디오 코딩 방법은 Hotho, G., van de Par, S., 및 Breebaart, J.의 "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693에서 설명된 것과 같은, "시간적 순열(temporal permutation) 방법"이다. 이러한 문서에서, 박수(applause) 유사 신호들의 코딩/디코딩에 맞도록 만든 공간적 오디오 코딩 방법이 제안되었다. 이러한 개념은 모노포닉(monophonic) 오디오 신호, 특히, 공간적 오디오 코더의 다운믹스 신호의 세그먼트들의 지각 유사성에 의존한다. 모노포닉 오디오 신호는 오버래핑 시간 세그먼트들로 세그먼트화된다. 이러한 세그먼트들은 "슈퍼(super)"-블록 내에서 슈도 랜덤하게(pseudo randomly, n 출력 채널들에 상호 독립적인) 시간적으로 순열된다.
또 다른 공간적 오디오 코딩 기술은 "시간적 지연 및 스와핑(swapping) 방법"이다. 독일특허 DE 10 2007 018032 A에서, 또한 양이(binaural) 표현을 위한 박수 유사 신호들의 코딩/디코딩에 맞도록 만든 방법이 제안된다. 이러한 방법은 또한 모노포닉 오디오 신호의 세그먼트들 및 다른 하나와 관련된 출력 채널들의 지연들에 의존한다. 선두 채널을 향한 위치 바이어스를 방지하기 위하여 선두 및 래깅(lagging) 채널이 주기적으로 스와핑된다.
일반적으로, 파라메트릭 공간적 오디오 코더들에서 코딩/디코딩되는 스테레오 또는 다중채널 박수 유사 신호들은 감소된 신호 품질을 야기하는 것으로 알려진다(예를 들면, Hotho, G., van de Par, S., 및 Breebaart, J.의 "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693 참조, 또한 독일특허 DE 10 2007 018032 A 참조). 박수 유사 신호들은 서로 다른 방향들로부터 트랜지언트들의 시간적으로 밀집한 혼합체들을 포함하는 것을 특징으로 한다. 그러한 신호들을 위한 예들은 비(rain), 질주하는 말의 음향 등이다. 박수 유사 신호들은 때때로 또한 지각적으로 잡음 유사의, 부드러운, 배경 음장으로 융합되는, 떨어져 있는 음향 소스(source)들로부터의 음향 성분들을 포함한다.
MPEG 서라운드와 같은 공간적 오디오 디코더들에 사용되는 최신 역상관 기술들은 격자 전역통과 구조들을 포함한다. 이들은 인공 에코(reverb) 발생기들로서 작용하고 따라서 균질의, 부드러운, 잡음 유사의, 실감 음향(immersive sound)을 발생시키기에 매우 적합하다. 그러나, 여전히 청취자를 실감시키는 비-균질의 시-공간 구조를 갖는 음장의 예들이 존재한다. 하나의 주요 예가 균질의 잡음 유사 음장뿐만 아니라 서로 다른 방향으로부터의 단일 클랩(clap)들의 덜 밀집한 시퀀스에 의해 청취자-포위(envelopment)를 생성하는 박수 유사 음장이다. 따라서 박수 음장들의 비-균질 성분은 트랜지언트들의 공간적으로 분포되는 혼합체를 특징으로 한다. 분명히, 이러한 뚜렷한 클랩들은 전혀 균질의, 부드럽고 잡음 같지 않다.
에코-유사 행동에 기인하여, 격자 전역통과 역상관기들은 예를 들면, 박수의 특성들을 갖는 실감 음장을 발생킬 수 없다. 대신에, 박수 유사 신호들에 적용될 때, 그것들은 신호들 내의 트랜지언트들을 공간적으로 스미어링(smearing)하는 경향이 있다. 바람직하지 않은 결과는 박수 유사 음장의 독특한 시-공간적 구조 없는 잡음 유사 실감 음장이다. 또한, 단일 박수와 같은 트랜지언트 이벤트들은 역상관기 필터들의 신호 아티팩트들을 유발할 수 있다.
Hotho, G., van de Par, S., 및 Breebaart, J.의 "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693에 따른 시스템은 출력 오디오 신호에서의 특정 반복 품질에 기인하는 출력 음향의 감지할 수 있는 저하를 나타낼 것이다. 이는 입력 신호의 하나의 동일한 세그먼트가 모든 출력 채널에서(비록 서로 다른 시점이나) 변경되지 않은 채로 나타나는 사실 때문이다. 게다가, 증가된 박수 밀도를 방지하기 위하여, 일부 원래의 채널들은 업믹스에서 떨어뜨려져야만 하고 따라서 결과로서 생기는 업믹스에서 일부 중요한 청각 이벤트가 손실될 수 있다. 방법은 만일 동일한 지각 특성들을 공유하는 신호 세그먼트들, 즉 유사하게 들리는 신호 세그먼트들을 찾는 것이 가능하면 적용가능하다. 방법은 보통 단지 극히 소수의 신호들만을 위하여 수용가능한, 신호들의 공간적 구조를 심하게 변경한다. 방법을 비-박수-유사 신호들(예를 들면, 신호 오분류에 기인하는)에 적용하는 경우에 있어서, 공간적 순열은 대부분 수용 불가능한 결과들에 이르게 할 것이다. 공간적 순열은 일부 신호 세그먼트들이 에코 또는 콤-필터링(comb-filtering)과 같은 아티팩트들 없이 함께 혼합될 수 있는 경우에서의 적용을 제한한다. 유사한 단점들이 독일특허 DE 10 2007 018032A에 설명된 방법에 적용된다.
국제특허 WO/2010/017967에서 설명된 의미론적 업믹스 과정은 역상관기들의 적용 이전에 신호들의 트랜지언트 성분들을 분리한다. 나머지(트랜지언트가 없는) 신호는 종래의 역상관기 및 업믹스 프로세서로 제공되며, 반면에 트랜지언트 신호들은 서로 다르게 처리된다. 후자는 (예를 들면, 랜덤하게) 진폭 패닝(amplitude panning) 기술의 적용에 의해 스테레오 또는 다중채널 출력 신호의 서로 다른 채널들에 분포된다. 진폭 패닝은 일부 단점들을 나타낸다.
진폭 패닝은 반드시 원래(original)에 가까운 출력 신호를 생산하는 것은 아니다. 출력 신호는 만일 원래 신호 내의 트랜지언트들의 분포가 진폭 패닝 법칙에 의해 설명될 수 있으면 원래에 가까울 수 있다. 즉, 진폭 패닝은 순수하게 진폭 패닝된 이벤트들만을 재생산할 수 있으나, 위상(phase) 또는 서로 다른 출력 채널들 내의 트랜지언트 성분들 사이의 시간 차이는 재생산할 수 없다.
게다가, MPEG 서라운드에서의 진폭 패닝 접근법의 적용은 역상관기뿐만 아니라 업믹스 매트릭스의 바이패스(bypass)를 필요로 할 수 있다. 업믹스 매트릭스는 정확한 공간 특성들을 나타내는 업믹스 출력을 합성하는데 필요한 공간 파라미터들(채널간 상관관계들, 채널간 레벨 차이들)을 반영하기 때문에, 패닝 시스템 자체는 정확한 공간 특성들을 갖는 출력 신호들을 합성하기 위하여 일부 규칙을 적용하여야만 한다. 그렇게 하기 위한 포괄적인 규칙은 알려져 있지 않다. 또한, 이러한 구조는 복잡도를 더하는데 그 이유는 공간 파라미터들이 첫 번째는 신호의 비-트랜지언트 부분을 위하여, 두 번째는 신호의 진폭 패닝된 트랜지언트 부분을 위하여, 두 번 처리되어야만 하기 때문이다.
따라서, 본 발명이 목적은 신호를 디코딩하기 위하여 역상관된 신호를 발생시키기 위한 향상된 개념을 제공하는 것이다. 본 발명의 목적은 청구항 1에 따른 신호의 디코딩을 위하여 발생시키기 위한 장치, 청구항 13에 따른 신호의 디코딩을 위하여 발생시키기 위한 방법 및 청구항 14에 따른 컴퓨터 프로그램이 저장된 매체에 의해 해결된다.
일 실시 예에 따른 장치는 제 1 신호 성분이 입력 신호의 트랜지언트 신호 부들을 포함하고 제 2 신호 성분이 입력 신호의 비-트랜지언트 신호 부들을 포함하는 것과 같이 입력 신호를 제 1 신호 성분 및 제 2 신호 성분으로 분리하기 위한 트랜지언트 분리기(transient separator)를 포함한다. 트랜지언트 분리기는 트랜지언트들을 포함하는 신호 성분들이 트랜지언트들을 포함하지 않는 신호 성분들과 다르게 처리될 수 있도록 허용하기 위하여 서로로부터 다른 신호 성분들을 분리할 수 있다.
장치는 또한 특히 트랜지언트들을 포함하는 신호 성분들을 역상관시키기에 적합한 역상관 방법에 따라 트랜지언트들을 포함하는 신호 성분들을 역상관시키기 위한 트랜지언트 역상관기를 포함한다. 게다가, 장치는 트랜지언트들을 포함하지 않는 신호 성분들을 역상관시키기 위한 제 2 역상관기를 포함한다.
따라서, 장치는 표준 역상관기를 사용하여 신호 성분들을 처리하거나 또는 대안으로서 특히 트랜지언트 신호 성분들을 처리하기에 적합한 트랜지언트 역상관기를 사용하여 신호 성분들을 처리할 수 있다. 일 실시 예에서, 트랜지언트 분리기는 신호 성분이 표준 역상관기 내로 제공되는지 또는 트랜지언트 역상관기 내로 제공되는지를 결정한다.
게다가, 장치는 신호 성분이 부분적으로 트랜지언트 역상관기 내로 제공되고 부분적으로 제 2 역상관기에 제공되도록 적용될 수 있다.
게다가, 장치는 역상관된 결합 신호를 발생시키기 위하여 표준 역상관기 및 트랜지언트 역상관기에 의해 출력되는 신호 성분들을 결합하기 위한 결합 유닛(combining unit)을 포함한다.
일 실시 예에서, 장치는 입력 신호들을 수신하도록 적용되고 게다가 입력 신호들 및 믹싱 룰을 기초로 하여 출력 신호들을 발생시키도록 적용되는 믹서를 포함한다. 장치 입력 신호는 트랜지언트 분리기 내로 제공되고 그 후에 트랜지언트 분리기 및/또는 위에서 설명된 것과 같은 제 2 역상관기에 의해 역상관된다. 결합 유닛 및 믹서는 역상관된 결합 신호가 제 1 믹서 입력 신호로서 믹서 내로 제공되도록 하기 위하여 배치될 수 있다. 제 2 믹서 입력 신호는 장치 압력 신호 또는 장치 입력 신호로부터 유래되는 신호일 수 있다. 역상관된 결합 신호가 믹서 내로 제공될 때 역상관 과정이 이미 완료되기 때문에, 믹서에 의해 트랜지언트 역상관이 고려될 필요는 없다. 따라서 종래의 믹서가 사용될 수 있다.
또 다른 실시 예에서, 믹서는 두 개의 신호들 사이의 상관관계 또는 간섭성을 나타내는 상관관계/간섭성 파라미터 데이터를 수신하고 상관관계/간섭성 파라미터 데이터를 기초로 하여 출력 신호들을 발생시키도록 적용된다. 또 다른 실시 예에서, 믹서는 두 개의 신호들 사이의 에너지 차이를 나타내는 레벨 차이 파라미터 데이터를 수신하고 레벨 차이 파라미터 데이터를 기초로 하여 출력 신호들을 발생시키도록 적용된다. 그러한 실시 예에서, 트랜지언트 역상관기, 제 2 역상관기 및 결합 유닛은 그러한 파라미터 데이터를 처리하도록 적용될 필요가 없는데, 그 이유는 믹서가 상응하는 데이터의 처리를 수행할 것이기 때문이다. 다른 한편으로는, 그러한 실시 예에서 종래의 상관관계/간섭성 및 레벨 차이 파라미터 처리를 갖는 종래의 믹서가 사용될 수 있다.
일 실시 예에서, 트랜지언트 분리기는 고려되는 신호 부가 트랜지언트를 포함하는 것을 나타내거나 또는 고려되는 신호 부가 트랜지언트를 포함하지 않는 것을 나타내는 트랜지언트 분리 정보에 따라 장치 입력 신호의 고려되는 신호 부를 트랜지언트 역상관기 내로 제공하거나 또는 고려되는 신호 부를 제 2 역상관기 내로 제공한다. 그러한 실시 예는 트랜지언트 분리 정보의 쉬운 처리를 허용한다.
또 다른 실시 예에서, 트랜지언트 분리기는 장치 입력 신호의 고려되는 신호 부를 부분적으로 트랜지언트 역상관기 내로 제공하도록 적용되고 고려되는 신호 부를 부분적으로 제 2 역상관기 내로 제공하도록 적용된다. 트랜지언트 분리기 내로 제공되는 고려되는 신호 부의 양 및 제 2 역상관기 내로 제공되는 고려되는 신호 부의 양은 트랜지언트 분리 정보에 의존한다. 이렇게 함으로서, 트랜지언트의 강도가 고려될 수 있다.
또 다른 실시 예에서, 트랜지언트 분리기는 주파수 도메인 내에서 표현되는 장치 입력 신호를 분리하도록 적용된다. 이는 주파수 의존 트랜지언트 처리(분리 및 역상관)를 허용한다. 따라서, 제 1 주파수 대역의 특정 신호 성분들은 트랜지언트 역상관 방법에 따라 처리될 수 있으며, 반면에 또 다른 주파수 대역의 특정 신호 성분들은 또 다른 방법, 예를 들면, 종래의 역상관 방법에 따라 처리될 수 있다. 따라서, 일 실시 예에서 트랜지언트 분리기는 주파수 의존 트랜지언트 분리 정보를 기초로 하여 장치 입력 신호를 분리하도록 적용된다. 그러나, 대안의 실시 예에서, 트랜지언트 분리기는 주파수 독립(independent) 분리 정보를 기초로 하여 장치 입력 신호를 분리하도록 적용된다. 이는 더 효율적인 트랜지언트 신호 처리를 허용한다.
일 실시 예에서, 트랜지언트 분리기는 제 1 주파수 범위 내의 모든 신호 부들이 제 2 역상관기 내로 제공되는 것과 같이 주파수 도메인에서 표현되는 장치 입력 신호를 분리하도록 적용될 수 있다. 따라서 상응하는 장치는 제 2 주파수 범위 내의 신호 주파수들을 갖는 신호 성분들로의 트랜지언트 신호 처리를 제한하도록 적용되며, 제 1 주파수 범위 내의 신호 주파수들을 갖는 어떠한 신호 성분들도 트랜지언트 역상관기 내로 제공되지 않는다(그러나 대신에 제 2 역상관기 내로).
또 다른 실시 예에서, 트랜지언트 역상관기는 잔여 신호 및 다운믹스 신호 사이의 위상 차이를 표현하는 위상 정보를 적용함으로써 제 1 신호 성분을 역상관시키도록 적용될 수 있다. 인코더 면 상에서, 위에서 설명된 것과 같이, 예를 들면, 스테레오 신호의 두 개의 채널로부터 다운믹스 신호 및 잔여 신호를 생성하기 위하여 "역(reverse)" 믹싱 매트릭스가 사용될 수 있다. 다운믹스 신호는 디코더로 전송될 수 있으나, 잔여 신호는 버려질 수 있다. 일 실시 예에 따라, 트랜지언트 역상관기에 의해 사용되는 위상 차이는 잔여 신호 및 다운믹스 신호 사이의 위상 차이일 수 있다. 따라서 잔여 신호의 원래의 위상을 다운믹스 상에 적용함으로써, "인공" 잔여 신호를 재구성하는 것이 가능할 수 있다. 일 실시 예에서, 위상 차이는 특정 주파수 대역과 관련될 수 있는데, 즉, 주파수 의존적일 수 있다. 대안으로서, 위상 차이는 특정 주파수 대역과 관련되지 않으나 주파수 독립 광대역 파라미터로서 적용될 수 있다.
일 실시 예에서, 장치는 위상 정보를 수신하기 위한 수신 유닛(receiving unit)을 포함하는데, 트랜지언트 역상관기는 위상 정보를 제 1 신호 성분에 적용하도록 적용된다. 위상 정보는 적절한 인코더에 의해 발생될 수 있다.
또 다른 실시 예에서 위상 기간은 제 1 신호 성분 내의 위상 기간을 곱함으로써(multiply) 제 1 신호 성분에 적용될 수 있다.
또 다른 실시 예에서, 제 2 역상관기는 종래의 역상관기, 예를 들면, 격자 무한 임펄스 응답 역상관기일 수 있다.
이제 도면들과 관련하여 실시 예들이 더 상세히 설명될 것이다.
도 1은 모노 대 스테레오 업-믹서의 기술 적용의 상태를 도시한다.
도 2는 모노 대 스테레오 업-믹서의 기술 적용의 또 다른 상태를 도시한다.
도 3은 일 실시 예에 따라 역상관된 신호를 발생시키기 위한 장치를 도시한다.
도 4는 일 실시 예에 따른 신호를 디코딩하기 위한 장치를 도시한다.
도 5는 일 실시 예에 따른 1-대-2 시스템 개요이다.
도 6은 또 다른 실시 예에 따라 수신 유닛을 포함하는 역상관된 신호를 발생시키기 위한 장치를 도시한다.
도 7은 또 다른 실시 예에 따른 1-대-2 시스템 개요이다.
도 8은 위상 일관성 측정으로부터 트랜지언트 분리 강도로의 바람직한 매핑을 도시한다.
도 9는 또 다른 실시 예에 따른 1-대-2 시스템 개요이다.
도 10은 일 실시 예에 따라 복수의 채널들을 갖는 오디오 신호를 인코딩하기 위한 장치를 도시한다.
도 1은 모노 대 스테레오 업-믹서의 기술 적용의 상태를 도시한다.
도 2는 모노 대 스테레오 업-믹서의 기술 적용의 또 다른 상태를 도시한다.
도 3은 일 실시 예에 따라 역상관된 신호를 발생시키기 위한 장치를 도시한다.
도 4는 일 실시 예에 따른 신호를 디코딩하기 위한 장치를 도시한다.
도 5는 일 실시 예에 따른 1-대-2 시스템 개요이다.
도 6은 또 다른 실시 예에 따라 수신 유닛을 포함하는 역상관된 신호를 발생시키기 위한 장치를 도시한다.
도 7은 또 다른 실시 예에 따른 1-대-2 시스템 개요이다.
도 8은 위상 일관성 측정으로부터 트랜지언트 분리 강도로의 바람직한 매핑을 도시한다.
도 9는 또 다른 실시 예에 따른 1-대-2 시스템 개요이다.
도 10은 일 실시 예에 따라 복수의 채널들을 갖는 오디오 신호를 인코딩하기 위한 장치를 도시한다.
도 3은 일 실시 예에 따라 역상관된 신호를 발생시키기 위한 장치를 도시한다. 장치는 트랜지언트 분리기(310), 트랜지언트 역상관기(320), 종래의 역상관기(330) 및 결합 유닛(340)을 포함한다. 이러한 실시 예의 트랜지언트 처리 접근법은 예를 들면, 공간적 오디오 디코더들의 업믹스-과정에서의 적용을 위하여, 박수 유사 오디오 신호들로부터 역상관된 신호들을 발생시키는 것을 목적으로 한다.
도 3에서, 입력 신호는 트랜지언트 분리기(310) 내로 제공된다. 입력 신호는 예를 들면, 하이브리드(hybrid) 직각 대칭 필터(QMF) 필터 뱅크를 적용함으로써 주파수 도메인으로 변환되었을 수 있다. 트랜지언트 분리기(310)는 입력 신호의 각각의 고려되는 신호 성분을 위하여 그것이 트랜지언트를 포함하는지를 결정할 수 있다. 게다가, 트랜지언트 분리기(310)는 만일 고려되는 신호 부가 트랜지언트(신호 성분(s1))를 포함하면, 고려되는 신호 부를 트랜지언트 역상관기(320) 내로 배치할 수 있거나 또는 만일 고려되는 신호 부가 트랜지언트(신호 성분(s2))를 포함하지 않으면, 고려되는 신호 부를 종래의 역상관기(330) 내로 제공하도록 배치할 수 있다. 트랜지언트 분리기(310)는 또한 고려되는 신호 부 내의 트랜지언트의 존재에 따라 고려되는 신호 부를 분할하고 그것들을 부분적으로 트랜지언트 역상관기(320) 및 부분적으로 종래의 역상관기(330)에 제공하도록 배치될 수 있다.
일 실시 예에서, 트랜지언트 역상관기(320)는 트랜지언트 신호 성분들을 역상관시키기에 특히 적합한 트랜지언트 역상관 방법에 따라 신호 성분(s1)을 역상관시킨다. 예를 들면, 트랜지언트 신호 성분들의 역상관은 위상 정보의 적용, 예를 들면, 위상 기간들의 적용에 의해 수행될 수 있다. 위상 기간들이 트랜지언트 신호 성분들 상에 적용되는 역상관 방법은 도 5의 실시 예와 관련하여 아래에 설명된다. 그러한 역상관 방법은 또한 도 3의 실시 예의 트랜지언트 역상관기(320)의 트랜지언트 역상관 방법으로서 사용될 수 있다.
비-트랜지언트 신호 부들을 포함하는, 신호 성분(s2)은 종래의 역상관기(320) 내로 제공된다. 종래의 역상관기(320)는 그리고 나서 종래의 역상관 방법에 따라, 예를 들면, 격자 전역통과 구조들, 예를 들면 격자 무한 임펄스 응답 필터의 적용에 의해 신호 성분(s2)을 역상관시킬 수 있다.
종래의 역상관기(330)에 의해 역상관된 후에, 종래의 역상관기(330)로부터 역상관된 신호 성분은 결합 유닛(340) 내로 제공된다. 트랜지언트 역상관기(320)로부터 역상관된 신호 성분이 또한 결합 유닛(340) 내로 제공된다. 결합 유닛(340)은 그리고 나서 역상관 신호 결합을 획득하기 위하여, 예를 들면, 신호 성분들 모두를 더함으로써 두 역상관된 신호 성분들 모두를 결합한다.
일반적으로, 일 실시 예에 따라 트랜지언트를 포함하는 신호를 역상관시키는 방법은 다음과 같이 수행될 수 있다.
분리 단계에서, 입력 신호는 두 개의 성분으로 분리된다. 하나의 성분(s1)은 입력 신호의 트랜지언트를 포함하고, 또 다른 성분(s2)은 입력 신호의 나머지(비-트랜지언트) 부분을 포함한다. 신호의 비-트랜지언트 성분(s2)은 본 실시 예의 트랜지언트 역상관기의 역상관 방법을 적용하지 않는 시스템에서와 유사하게 처리될 수 있다. 즉, 트랜지언트가 없는 신호(s2)는 격자 무한 임펄스 응답 전역통과 구조들과 같은 하나 또는 몇몇의 종래의 역상관 신호 처리 구조들에 제공될 수 있다.
게다가, 트랜지언트들을 포함하는 신호 성분(트랜지언트 스트림(s1))은 트랜지언트 스트림들 역상관시키는 "트랜지언트 역상관기" 구조에 제공되는데, 이는 종래의 역상관 구조들보다 더 나은 스펙트럼 신호 특성들을 유지한다. 트랜지언트 스트림의 역상관은 높은 시간 해상도(temporal resolution)에서 위상 정보의 적용에 의해 수행된다. 바람직하게는, 위상 정보는 위상 기간들을 포함한다. 게다가, 인코더에 의해 위상 정보가 제공될 수 있는 것이 바람직하다.
게다가, 종래의 역상관기 및 트랜지언트 역상관기 모두의 출력 신호들은 공간적 오디오 코더들의 업믹스-과정에서 사용될 수 있는 역상관된 신호를 형성하기 위하여 결합된다. 공간적 오디오 디코더의 믹싱-매트릭스(Mmix)의 구성요소들(h11, h12, h21, h22)은 변하지 않은 채로 있을 수 있다.
도 4는 일 실시 예에 따라 장치 입력 신호를 디코딩하기 위한 장치를 도시하는데, 장치 입력 신호는 트랜지언트 분리기(410) 내로 제공된다. 장치는 트랜지언트 분리기(410), 트랜지언트 역상관기(420), 종래의 역상관기(430), 결합 유닛(440) 및 믹서(450)를 포함한다. 본 실시 예의 트랜지언트 분리기(410), 트랜지언트 역상관기(420), 종래의 역상관기(430) 및 결합 유닛(440)은 각각 도 3의 실시 예의 트랜지언트 분리기(310), 트랜지언트 역상관기(320), 종래의 역상관기(330), 결합 유닛(340)과 유사할 수 있다. 결합 유닛(440)에 의해 발생된 역상관된 결합 신호는 제 1 믹서 입력 신호로서 믹서(450) 내로 제공된다. 게다가, 트랜지언트 분리기(410) 내로 제공되었던 장치 입력 신호가 또한 제 2 믹서 입력 신호로서 믹서(450) 내로 제공된다. 대안으로서, 장치 입력 신호는 믹서(450) 내로 직접적으로 제공되지 않으나, 장치 입력 신호로부터 유래된 신호가 믹서(450) 내로 제공된다. 신호는 예를 들면, 장치 입력 신호에 대하여 종래의 신호 처리 방법을 적용함으로써, 예를 들면, 필터를 적용함으로써, 장치 입력 신호로부터 유래될 수 있다. 실시 예 4의 믹서(450)는 입력 신호들 및 믹싱 룰을 기초로 하여 출력 신호들을 발생시키도록 적용된다. 그러한 믹싱 룰은 예를 들면, 다음의 공식을 적용함으로써, 입력 신호들 및 믹싱 매트릭스를 곱하는 것일 수 있다:
믹서(450)는 상관관계/간섭성 파라미터 데이터, 예를 들면, 채널간 상관관계/간섭성, 및/또는 레벨 차이 파라미터 데이터, 예를 들면, 채널간 레벨 차이를 기초로 하여 출력 채널들(L, R)을 발생시킬 수 있다. 예를 들면, 믹싱 매트릭스의 계수는 상관관계/간섭성 파라미터 데이터 및/또는 레벨 차이 파라미터 데이터에 의존할 수 있다. 도 4의 실시 예들에서, 믹서(450)는 두 개의 출력 채널(L 및 R)을 발생시킨다. 그러나, 대안의 실시 예들에서, 믹서는 서라운드 음향 신호들일 수 있는, 복수의 출력 신호들, 예를 들면, 3, 4, 5 또는 9개의 출력 신호들을 발생시킬 수 있다.
도 5는 일 실시 예의 1-대-2 업믹스 시스템, 예를 들면, MPEG 서라운드 공간 오디오 디코더의 1-대-2 박스에서의 트랜지언트 처리 접근법의 시스템 개요를 도시한다. 일 실시 예에 따른 분리된 트랜지언트들을 위한 병렬 신호 경로는 U-형태의 트랜지언트 처리 박스 내에 포함된다. 장치 입력 신호(DMX)는 트랜지언트 분리기(510) 내로 제공된다. 장치 입력 신호는 주파수 도메인 내에서 표현될 수 있다. 예를 들면, 시간 도메인 입력 신호는 MPEG 서라운드에서 사용된 것과 같은 직각 대칭 필터 필터 뱅크를 적용함으로써 주파수 도메인으로 변환되었을 수 있다. 트랜지언트 분리기(510)는 그리고 나서 장치 입력 신호(DMX)의 성분들을 트랜지언트 역상관기(520) 내로 및/또는 격자 무한 임펄스 응답 역상관기(530)내로 제공될 수 있다. 장치 입력 신호의 성분들은 그리고 나서 트랜지언트 역상관기(520) 및/또는 격자 무한 임펄스 응답 역상관기(530)에 의해 역상관된다. 그 후에, 역상관된 신호 성분들(D1 및 D2)은 역상관된 결합 신호(D)를 획득하기 위하여, 결합 유닛(540)에 의해, 예를 들면, 두 신호 성분들을 더함으로써 결합된다. 역상관된 결합 신호는 제 1 믹서 입력 신호(D)로서 믹서(552) 내로 제공된다. 게다가, 장치 입력 신호(DMX, 또는 대안으로서 장치 입력 신호(DMX)로부터 유래된 신호)가 또한 제 2 믹서 입력 신호로서 믹서(552) 내로 제공된다. 믹서(552)는 그리고 나서 장치 입력 신호(DMX)에 따라, 제 1 및 제 2 "원래의" 신호를 발생시킨다. 믹서(552)는 또한 역상관된 결합 신호(D)에 따라 제 1 및 제 2 "가공된" 신호를 발생시킨다. 믹서(552)에 의해 발생된, 신호들은 또한 전송된 파라미터들, 예를 들면, 상관관계/간섭성 파라미터 데이터, 예를 들면, 채널간 상관관계/간섭성, 및/또는 레벨 차이 파라미터 데이터, 예를 들면, 채널간 레벨 차이를 기초로 하여 발생될 수 있다. 일 실시 예에서, 믹서(552)에 의해 발생된 신호들은 제공된 시간 형상 데이터를 기초로 하여 제공된 신호들을 형상화하는 형상 유닛(shape unit, 554)에 제공될 수 있다. 다른 실시 예들에서, 어떠한 신호 형상도 발생하지 않는다. 발생된 신호들은 그리고 나서 각각 제 1 출력 신호(L) 및 제 2 출력 신호(R)를 발생시키기 위하여 제공된 신호들을 결합하는 제 1(556) 또는 제 2(558) 가산 유닛(adding unit)에 제공된다.
도 5에 도시된 처리 원리들은 모노-대-스테레오 업믹스 시스템들(예를 들면, 스테레오 오디오 코더들)뿐만 아니라 다중 채널 설정들(예를 들면, MPEG 서라운드)에서 적용될 수 있다. 실시 예들에서, 제안된 트랜지언트 처리 방법은 업믹스 시스템의 큰 개념적 변화없이 존재하는 업믹스 시스템들에 대한 업그레이드로서 적용될 수 있는데, 그 이유는 업믹스 과정 자체를 변경하지 않고 병렬 역상관기 신호 경로만이 도입되기 때문이다.
트랜지언트 및 비-트랜지언트 성분으로의 신호 분리는 인코더 및/또는 공간적 오디오 디코더 내에서 발생될 수 있는 파라미터들에 의해 제어된다. 트랜지언트 역상관기(520)는 위상 정보, 예를 들면, 인코더 내에서 또는 공간적 오디오 디코더 내에서 획득될 수 있는 위상 기간들을 사용한다. 트랜지언트 처리 파라미터들(즉, 트랜지언트 부들 또는 분리 강도와 같은 트랜지언트 분리 파라미터들 및 위상 정보와 같은 트랜지언트 역상관 파라미터들)이 아래에 설명된다.
입력 신호는 주파수 도메인 내에서 표현될 수 있다. 예를 들면, 신호는 분석 필터 뱅크를 사용함으로써 주파수 도메인으로 변환되었을 수 있다. 직각 대칭 필터 필터 뱅크는 시간 도메인 신호로부터 복수의 부대역 신호들을 획득하도록 적용될 수 있다.
최상의 지각 품질을 위하여, 트랜지언트 신호 처리는 바람직하게는 한정된 주파수 범위 내의 신호 주파수들에 제한될 수 있다. 하나의 예가 처리 범위를 MPEG 서라운드에서의 도입된 엔벨로프 형상(guided envelope shaping)의 주파수 대역 제한과 유사한, MPEG 서라운드에서 사용되는 것과 같은 하이브리드 직각 대칭 필터 필터 뱅크의 주파수 대역 지수 k≥8에 한정하는 것일 수 있다.
다음에서, 트랜지언트 분리기(510)의 실시 예들이 더 상세히 설명된다. 트랜지언트 분리기(510)는 입력 신호(DMX)를 각각 트랜지언트 및 비-트랜지언트 성분들(s1 및 s2)로 분할한다. 트랜지언트 분리기(510)는 입력 신호(DMX)를 분할하기 위하여 트랜지언트 분리 정보, 예를 들면 트랜지언트 분리 파라미터(β[n])를 사용할 수 있다. 입력 신호(DMX)의 분할은 성분의 합(s1+s2)이 입력 신호(DMX)와 동등한 것과 같은 방법으로 행해질 수 있다:
s1[n]=DMX[n]·β[n]
s2[n]=DMX[n]·(1-β[n])
여기서 n은 다운샘플링된 부대역 신호들의 시간 지수이고 시간 가변 트랜지언트 분리 파라미터(β[n])를 위한 유효 값들은 [0, 1] 범위 내이다. β[n]은 주파수 독립 파라미터일 수 있다. 주파수 독립 분리 파라미터를 기초로 하여 장치 입력 신호를 분리하도록 적용되는 트랜지언트 분리기(510)는 시간 지수(n)를 갖는 모든 부대역 신호 부들을 β[n]의 값에 따라 트랜지언트 역상관기(520) 또는 제 2 역상관기 내로 제공될 수 있다.
게다가, β[n]은 주파수 의존 파라미터일 수 있다. 주파수 의존 트랜지언트 분리 정보를 기초로 하여 장치 입력 신호를 분리하도록 적용되는 트랜지언트 분리기(510)는 만일, 그것들의 상응하는 트랜지언트 분리 정보가 다르면, 동일한 시간 지수를 갖는 부대역 신호 부들을 다르게 처리할 수 있다.
게다가, 주파수 의존성은 예를 들면, 위에서 설명된 것과 같이 트랜지언트 처리의 주파수 범위를 한정하기 위하여 사용될 수 있다.
일 실시 예에서, 트랜지언트 분리 정보는 입력 신호(DMX)의 고려되는 신호 부가 트랜지언트를 포함하는 것을 나타내거나 또는 고려되는 신호 부가 트랜지언트를 포함하지 않는 것을 나타내는 파라미터일 수 있다. 만일 트랜지언트 분리 정보가 고려되는 신호 부가 트랜지언트를 포함하는 것을 나타내면, 트랜지언트 분리기(510)는 고려되는 신호 부를 트랜지언트 역상관기(520) 내로 제공한다. 대안으로서, 만일 트랜지언트 분리 정보가 고려되는 신호 부가 트랜지언트를 포함하는 것을 나타내면, 트랜지언트 분리기(510)는 고려되는 신호 부를 제 2 역상관기, 예를 들면 격자 무한 임펄스 응답 역상관기(530) 내로 제공한다.
예를 들면, 트랜지언트 분리 파라미터(β[n])는 2진(binary) 파라미터일 수 있는 트랜지언트 분리 정보로서 사용될 수 있다. n은 입력 신호(DMX)의 고려된 신호 부의 시간 지수이다. β[n]은 1(고려되는 신호 부가 트랜지언트 역상관기 내로 제공되어야만 하는 것을 나타내는) 또는 0((고려되는 신호 부가 제 2 역상관기 내로 제공되어야만 하는 것을 나타내는)일 수 있다. β[n]을 β∈{0, 1}로 제한하는 것은 어려운 트랜지언트/비-트랜지언트 결정을 야기하는데, 즉, 트랜지언트들로서 처리된 성분들은 입력(β=1)으로부터 완전히 분리된다.
또 다른 실시 예에서, 트랜지언트 분리기(510)는 장치 입력 신호의 고려되는 신호 부를 부분적으로 트랜지언트 역상관기(520) 내로 제공하고 고려되는 신호 부를 부분적으로 제 2 역상관기(530) 내로 제공하도록 적용된다. 트랜지언트 역상관기(520) 내로 제공되는 고려되는 신호 부의 양 및 제 2 역상관기(530) 내로 제공되는 고려되는 신호 부의 양은 트랜지언트 분리 정보에 의존한다. 일 실시 예에서, β[n]은 [0, 1] 범위 내에 존재하여야만 한다. 또 다른 실시 예에서, β[n]은 β[n]∈[0, βmax]로 제한될 수 있는데, 여기서 βmax>1이며, 트랜지언트의 부분 분리를 야기하며, 트랜지언트 처리 방법의 덜 두드러진 효과에 이르게 한다. 따라서, βmax의 변경은 트랜지언트 처리 없는 종래의 업믹스 처리 및 트랜지언트 처리를 포함하는 업믹스 처리의 출력 사이에서 사라지는 것을 허용한다.
다음에서, 일 실시 예에 따른 트랜지언트 역상관기(520)가 더 상세히 설명된다.
일 실시 예에 따른 트랜지언트 역상관기(520)는 입력에 충분히 역상관된 출력 신호를 생성한다. 그것은 단일 클랩들/트랜지언트들의 시간적 구조를 변경하지 않는다(시간적 스미어링(smearing)이 없고, 지연(delay)가 없는). 대신에, 그것은 원래의(코딩되지 않은) 신호에서의 공간 분포와 유사한, 트랜지언트 신호 성분들의 공간 분포에 이르게 한다(업믹스 과정 후에). 트랜지언트 역상관기(520)는 비트 레이트 대 품질 균형(trade-off)을 허용할 수 있다(예를 들면, 낮은 비트레이트에서 완전히 랜덤의 공간 트랜지언트 분포 ↔ 높은 비트레이트에서 원래에 가까운(거의 투명한)). 게다가, 이는 낮은 계산 복잡도로 달성된다.
위에서 설명된 것과 같이, 예를 들면, 스테레오 신호의 두 개의 채널로부터 인코더 면 상에서, 다운믹스 신호 및 잔여 신호를 생성하기 위하여 "역" 믹싱 매트릭스가 사용될 수 있다. 다운믹스 신호는 디코더로 전송될 수 있는 반면에, 잔여 신호는 버려질 수 있다. 일 실시 예에 따라, 잔여 신호 및 다운믹스 신호 사이의 위상 차이는 예를 들면, 인코더에 의해 결정될 수 있으며, 신호를 역상관시킬 때 디코더에 의해 사용될 수 있다. 이렇게 함으로써, 잔여의 원래 위상을 다운믹스 상에 적용함으로써 "인공" 잔여 신호를 재구성하는 것이 가능할 수 있다.
일 실시 예에 따른 트랜지언트 역상관기(520)의 상응하는 역상관 방법이 아래에 설명될 것이다.
트랜지언트 역상관 방법에 따라, 위상 기간이 사용될 수 있다. 역상관은 간단하게 트랜지언트 스트림과 높은 위상 해상도, 예를 들면, MPEG 서라운드와 같은 변환 도메인 시스템들에서의 부대역 신호 시간 해상도에서의 위상 기간을 곱함으로써 달성된다:
이러한 방정식에서, n은 다운샘플링된 부대역 신호들의 시간 지수이다. △φ는 다운믹스 및 잔여 사이의 위상 차이를 이상적으로 반영한다. 따라서, 트랜지언트 잔여들은 다운믹스로부터 트랜지언트들의 복사에 의해 대체되고, 그것들이 원래의 위상을 나타내는 것과 같이 변형된다.
위상 정보의 적용은 본질적으로 업믹스 과정에서 원래의 위치에 대한 트랜지언트들의 패닝을 야기한다. 설명의 예로서, 채널간 상관관계/간섭성=0, 채널간 레벨 차이=0인 경우가 고려된다. 출력 신호들의 트랜지언트 부는 그리고 나서 다음과 같이 판독한다:
△φ=0을 위하여 이는 L=2c*s, R=0을 야기하며, 반면에 △φ=π는 L=0, R=2c*s에 이르게 한다. △φ, 채널간 상관관계/간섭성, 및 채널간 레벨 차이의 다른 값들은 제공된 트랜지언트들 사이의 서로 다른 레벨 및 위상 관계들에 이르게 한다.
△φ[n] 값들은 주파수 독립 광대역 파라미터들로서 또는 주파수 의존 파라미터들로서 적용될 수 있다. 전체 성분들 없이 박수-유사 신호들의 경우에 있어서, 광대역 트랜지언트들의 낮은 데이터 레이트 요구 및 일정한 처리(주파수에 대한 일관성)에 기인하여 광대역 △φ[n] 값들이 바람직할 수 있다.
도 5의 트랜지언트 처리 구조는 종래의 역상관기(530)만이 트랜지언트 신호 성분들에 대하여 바이패스되고 믹싱 매트릭스는 변경되지 않은 채로 있는 것과 같이 배치된다. 따라서, 공간 파라미터들(채널간 상관관계/간섭성, 채널간 레벨 차이)이 또한 본질적으로 트랜지언트 신호들을 위하여 고려되는데, 예를 들면, 채널간 상관관계/간섭성은 제공된 트랜지언트 분산의 폭을 자동으로 제어한다.
위상 정보를 어떻게 획득하는가의 양상을 고려하면, 일 실시 예에서, 위상 정보는 인코더로부터 수신될 수 있다.
도 6은 역상관된 신호를 발생시키기 위한 장치의 일 실시 예를 도시한다. 장치는 트랜지언트 분리기(610), 트랜지언트 역상관기(620), 종래의 역상관기(630), 결합 유닛(640) 및 수신 유닛(650)을 포함한다. 트랜지언트 분리기(610), 종래의 역상관기(630) 및 결합 유닛(640)은 도 3에 도시된 실시 예의 트랜지언트 분리기(310), 종래의 역상관기(330) 및 결합 유닛(340)와 유사하다. 그러나, 도 6은 게다가 위상 정보를 수신하도록 적용되는 수신 유닛(650)을 도시한다. 위상 정보는 인코더(도시되지 않음)에 의해 전송되었을 수 있다. 예를 들면, 인코더는 잔여 및 다운믹스 신호들 사이의 위상 차이(다운믹스에 대한 잔여 신호의 상대 위상)를 계산하였을 수 있다. 위상 차이는 특정 주파수 대역들 또는 광대역(예를 들면 시간 도메인 내의)을 위하여 계산되었을 수 있다. 인코더는 균일 또는 비-균일 양자화 및 잠재적으로 무손실 코딩에 의해 위상 값들을 적절하게 코딩할 수 있다. 그 후에, 인코더는 코딩된 위상 값들을 공간 오디오 디코딩 시스템에 전송할 수 있다. 인코더로부터의 위상 정보의 획득은 위상 정보가 그리고 나서 디코더로부터 이용가능하기 때문에(양자화 에러를 제외하고) 바람직하다.
수신 유닛(650)은 그것이 신호 성분을 역상관시킬 때 위상 정보를 위상 정보를 사용하는 트랜지언트 역상관기(620) 내로 제공한다. 예를 들면, 위상 정보는 위상 기간일 수 있으며 트랜지언트 역상관기(620)는 수신된 트랜지언트 신호와 위상 기간과 곱할 수 있다.
인코더로부터 디코더로 위상 정보(△φ[n])의 전송의 경우에 있어서, 필요로 하는 데이터 레이트는 다음과 같이 감소될 수 있다.
위상 정보(△φ[n])는 단지 디코더 내의 트랜지언트 신호 성분들에만 적용될 수 있다. 따라서, 위상 정보는 역상관되려는 신호 내에 트랜지언트 성분들이 존재하는 한 디코더 내에서 이용할 수 있는 것만 필요하다. 위상 정보의 전송은 따라서 단지 필요한 정보만이 디코더로 전송되는 것과 같이 인코더에 의해 제한될 수 있다. 이는 아래에 설명되는 것과 같이 인코더 내의 트랜지언트 검출을 적용함으로써 행해질 수 있다. 위상 정보(△φ[n])는 단지 트랜지언트들이 인코더 내에서 검출되었던, 어떤 시점들을 위하여 전송된다.
트랜지언트 분리의 양상을 고려하면, 일 실시 예에서, 트랜지언트 분리는 인코더 중심일 수 있다.
일 실시 예에 따라, 트랜지언트 분리 정보(또한 "트랜지언트 정보"로서 언급되는)가 인코더로부터 획득될 수 있다. 인코더는 Andreas Walther, Christian Uhlele, sascha Disch의 "Using Transient supression in Blind Multi-channel Up-mix Algorithms", Proc. 112nd AES Convention, vienna, Austria, May 2007에서 설명된 것과 같은 트랜지언트 검출 방법들을 인코더 입력 신호들 또는 다운믹스 신호들에 적용할 수 있다. 트랜지언트 정보는 그리고 나서 디코더에 전송되고 바람직하게는 예를 들면, 다운샘플링된 부대역 신호들의 시간 해상도에서 획득된다.
트랜지언트 정보는 시간 내의 각각의 신호 샘플을 위하여 바람직하게는 단순한 2진(트랜지언트/비-트랜지언트) 결정을 포함할 수 있다. 이러한 정보는 바람직하게는 또한 시간 내의 트랜지언트 위치들 및 트랜지언트 기간들에 의해 표현될 수 있다.
트랜지언트 정보는 인코더로부터 디코더로 트랜지언트 정보를 전송하기 위하여 필요한 데이터 레이트를 감소시키기 위하여 무손실 코딩될 수 있다(예를 들면, 런(run)-길이 코딩, 엔트로피 코딩).
트랜지언트 정보는 광대역 정보로서 또는 특정 주파수 해상도에서의 주파수 의존 정보로서 전송될 수 있다. 광대역 파라미터들로서의 트랜지언트 정보의 전송은 트랜지언트 정보 데이터 레이트를 감소시키고 잠재적으로 광대역 트랜지언트들의 일정한 처리에 기인하는 오디오 품질을 향상시킨다.
2진(트랜지언트/비-트랜지언트) 결정 대신에, 또한 트랜지언트들의 강도가 전송될 수 있는데, 예를 들면, 두 개 또는 네 개의 단계들로 양자화된다. 트랜지언트 강도는 그리고 나서 다음과 같이 공간 오디오 디코더 내의 트랜지언트들의 분리를 제어할 수 있다. 강한 트랜지언트들은 무한 임펄스 응답 격자 역상관기 입력으로부터 완전히 분리되나, 반면에 약한 트랜지언트들은 부분적으로만 분리되다.
트랜지언트 정보는 만일 인코더가 예를 들면, Christian Uhle의 "Applause Sound Detection with Low Intensity", Audio Engineering Society Convention 127, New York, 2009에서 설명된 것과 같은 박수 검출 시스템들을 사용하여 박수 유사 신호들을 검출하면, 전송될 수 있다.
박수-유사 신호들에 대한 입력 신호의 유사성을 위한 검출 결과는 또한 트랜지언트 분리의 강도를 제어하기 위하여 낮은 시간 해상도에서(예를 들면, MPEG 서라운드 내의 공간 파라미터들 업데이트 레이트에서) 디코더로 전송될 수 있다. 박수 결정 결과는 2진 파라미터(즉, 단단한 결정)로서 또는 비-2진 파라미터(즉, 연한 결정)로서 전송될 수 있다. 이러한 파라미터는 공간 오디오 디코더 내의 분리-강도를 제어한다. 따라서, 이는 디코더 내의 트랜지언트 처리를 (단단하게 또는 점차로) 스위치 온/오프하도록 허용한다. 이는 예를 들면, 전체 성분들을 포함하는 신호들에 광대역 트랜지언트 처리 방법을 적용할 때 발생할 수 있는 아티팩트들의 방지를 허용한다.
도 7은 일 실시 예에 따른 신호를 디코딩하기 위한 장치를 도시한다. 장치는 트랜지언트 분리기(710), 트랜지언트 역상관기(720), 격자 무한 임펄스 응답 역상관기(730), 결합 유닛(740), 믹서(752), 선택적 형상 유닛(554), 각각 도 5의 실시 예의 제 1 가산 유닛(556) 및 제 2 가산 유닛(558)을 포함한다. 도 7의 실시 예에서, 인코더는 위상 정보 및 트랜지언트 위치 정보를 획득하고 정보를 디코딩을 위한 장치로 전송한다. 어떤 잔여 신호들도 전송되지 않는다. 도 7은 MPEGS 서라운드에서의 1-대-2 박스와 같은 1-대-2 업믹스 설정을 도시한다. 이는 일 실시 예에 따라 모노 다운믹스로부터 스테레오 출력으로 업믹스하기 위하여 스테레오 코덱에 적용될 수 있다. 도 7의 실시 예에서, 세 개의 트랜지언트 처리 파라미터들이 도 7에 도시된 것과 같이, 인코더로부터 디코더로 주파수 독립 파라미터들로서 전송된다.
전송되는 제 1 트랜지언트 처리 파라미터는 인코더 내의 트랜지언트 검출 실행의 2진 트랜지언트/비-트랜지언트 결정이다. 이는 디코더 내의 트랜지언트 분리를 제어하기 위하여 사용될 수 있다. 간단한 방법에서, 2진 트랜지언트/비-트랜지언트 결정은 또 다른 코딩 없이 부대역 시간 샘플 당 2진 플래그(flag)로서 전송될 수 있다.
전송되는 또 다른 트랜지언트 처리 파라미터는 트랜지언트 역상관기를 위하여 필요한 위상 값(또는 위상 값들, △φ[n])이다. △φ는 단지 트랜지언트가 인코더 내에서 검출된, 시간(n)을 위하여 전송된다. △φ 값들은 예를 들면, 샘플 당 3 비트의 해상도를 갖는 양자화기(quantizer)의 지수들로서 전송된다.
전송되는 또 다른 트랜지언트 처리 파라미터는 분리 강도(즉, 트랜지언트 처리 방법의 효과 강도)이다. 이러한 정보는 공간 파라미터들 채널간 레벨 차이, 채널간 상관관계/간섭성과 같은 동일한 공간 해상도에서 전송된다.
인코더로부터 디코더로 트랜지언트 분리 결정들 및 광대역 위상 정보를 전송하기 위하여 필요한 비트 레이트(BR)는 다음과 같은 MPEG 서라운드 유사 시스템들을 위하여 평가될 수 있는데:
여기서 σ는 트랜지언트 밀도이고(트랜지언트들로 표시되는 시간 슬롯들(=부대역 시간 샘플들)의 분수)이고, Q는 전송된 위상 값 당 비트들의 수이며, fs는 샘플링 레이트이다. (fs/64)는 다운샘플링된 부대역 신호들의 샘플링 레이트라는 것에 유의하여야 한다.
일련의 일부 대표적인 박수 아이템들을 위하여 E{σ}<0.25가 측정되었는데, {,}는 아이템 기간에 대한 평균을 나타낸다. 위상 값들 및 파라미터 비트 레이트의 정확도 사이의 합리적인 절충은 Q=3이다. 파라미터 데이터 레이트를 감소시키기 위하여, 채널간 상관관계/간섭성들 및 채널간 레벨 차이들은 광대역 신호(cue)들로서 전송될 수 있다. 광대역 신호들로서의 채널간 상관관계/간섭성들 및 채널간 레벨 차이들의 전송은 특히 박수와 같은 비-음색(non-tonal) 신호들을 위하여 적용가능하다.
부가적으로, 분리 강도를 시그널링하기 위한 파라미터들은 채널간 상관관계/간섭성들/채널간 레벨 차이들의 업데이트 레이트에서 전송된다. MPEG 서라운드 내의 긴 공간 프레임들(32번 64 샘플들) 및 4-단계 양자화된 분리 강도들을 위하여, 이는 다음의 부가적인 비트 레이트를 야기한다.
BR transient separation flafs = (f s /(64·32))·2.
분리 강도 파라미터는 유사성을 박수-유사 신호들, 음색, 또는 실시 예의 트랜지언트 역상관을 적용할 때 잠재적인 장점들 또는 문제점들을 나타내는 다른 특성들에 액세스하는 신호 분석 알고리즘들의 결과로부터 인코더에서 유래될 수 있다.
트랜지언트 처리를 위하여 전송된 파라미터들은 낮은 파라미터 비트 레이터를 야기하는, 중복을 감소시키기 위하여 무손실 코딩이 필요할 수 있다(예를 들면, 트랜지언트 분리 정보의 런-길이 코딩, 엔트로피 코딩).
위상 정보의 획득의 양상으로 돌아가면, 일 실시 예에서, 위상 정보는 디코더 내에서 획득될 수 있다.
그러한 실시 예에서, 디코딩하기 위한 장치는 인코더로부터 위상 정보를 획득하지 않으나, 위상 정보 자체를 결정할 수 있다. 따라서, 감소된 전체 전송 레이트를 야기하는 위상 정보를 전송하는 것이 필요하지 않다.
일 실시 예에서, 위상 정보는 "도입된 엔벨로프 형상" 데이터로부터 MPEG 서라운드 기반 디코더에서 획득된다. 이는 단지 만일 도입된 엔벨로프 형상 데이터가 전송되면, 즉, 인코더 내에서 도입된 엔벨로프 형상 특성이 활성화되면 적용가능하다. 도입된 엔벨로프 형상 특성은 예를 들면, MPEG 서라운드 시스템들에서 이용가능하다. 출력 채널들 사이의 도입된 엔벨로프 형상 엔벨로프 값들의 비율은 높은 시간 해상도에서의 트랜지언트들을 위한 패닝 위치들을 반영한다. 도입된 엔벨로프 형상 엔벨로프 비율은 트랜지언트 처리를 위하여 필요한 위상 정보에 매핑될 수 있다. 도입된 엔벨로프 형상에서, 매핑은 적절한 테스트 신호들의 대표적인 세트를 위한 도입된 엔벨로프 형상 엔벨로프 비율에 대한 위상 분포의 건축 통계로부터 경험적으로 획득되는 매핑 룰에 따라 실행될 수 있다. 매핑 룰의 결정은 트랜지언트 처리 시스템을 적용할 때 실행 시간 과정이 아닌, 트랜지언트 처리 시스템을 디자인하기 위한 단계이다. 따라서, 만일 도입된 엔벨로프 형상 특성의 적용을 위하여 도입된 엔벨로프 형상 데이터가 필요하면 위상 데이터를 위하여 부가적인 전송 경비를 지출할 필요가 없는 것이 바람직하다. 비트스트림 후방 호환성은 MPEG 서라운드 비트스트림들/디코더들로 달성된다. 그러나, 도입된 엔벨로프 형상 데이터로부터 추출된 위상 정보는 인코더에서 획득될 수 있는 위상 정보만큼 정확하지 않다(예를 들면, 평가된 위상의 부호는 알려지지 않음).
또 다른 실시 예에서, 위상 정보는 또한 디코더 내에서, 그러나 전송된 비-전대역 잔여들로부터 획득될 수 있다. 이는 예를 들면, 만일 대역 제한 잔여 신호들이 MPEG 서라운드 코딩 방법으로 전송되면(일반적으로 특정 전이 주파수까지 주파수 범위를 포함하는) 적용가능하다. 그러한 실시 예에서, 즉, 잔여 신호들이 전송되는 주파수들을 위하여 잔여 대역(들) 내의 다운믹스 및 전송된 잔여 신호 사이의 위상 관계가 계산된다. 게다가, 잔여 대역(들)으로부터 비-잔여 대역(들)까지의 위상 정보가 추정(및/또는 가능하게는 보간)된다. 하나의 가능성은 잔여 대역(들) 내에서 획득된 위상 관계를 그때 트랜지언트 역상관기를 위하여 사용되는 글로벌 주파수 독립 위상 관계 값에 매핑하는 것이다. 이는 만일 그래도 비-전대역 잔여들이 전송되면 위상 데이터를 위하여 어떤 부가적인 전송 비용도 발생하지 않는다는 장점을 야기한다. 그러나, 위상 평가의 정확도는 잔여 신호들이 전송되는 주파수 대역(들)의 폭에 의존한다는 것이 고려되어야만 한다. 위상 평가의 정확도는 또한 주파수 축을 따라 다운믹스 및 잔여 신호 사이의 위상 관계의 일관성에 의존한다. 분명한 트랜지언트 신호들을 위하여, 대체로 높은 일관성이 요구된다.
또 다른 실시 예에서, 위상 정보는 인코더로부터 전송되는 부가적인 교정 정보를 사용하여 디코더에서 획득된다. 그러한 실시 예는 이전의 두 가지 실시 예들(도입된 엔벨로프 형상으로부터의 위상, 잔여들로부터의 위상)과 유사하나, 부가적으로, 디코더로 전송되는 인코더 내의 보정 데이터를 발생시키는 것이 필요하다. 보정 데이터는 이전에 설명된 두 가지 변형들(도입된 엔벨로프 형상으로부터의 위상, 잔여들로부터의 위상)에서 발생할 수 있는 위상 평가 에러의 감소를 허용한다. 게다가, 보정 데이터는 인코더 내의 디코더-면 위상 평가 에러의 평가로부터 유래될 수 있다. 게다가, 도입된 엔벨로프 데이터 접근법으로부터의 위상 평가와 관련하여, 보정 데이터는 간단하게 인코더에서 발생된 위상 값들의 정확한 사인(sign)일 수 있다. 그러한 접근법의 장점은 보정 데이터에 기인하여, 디코더에서 회복될 수 있는 위상 정보의 정확도가 인코더에서 발생된 위상 정보의 정확도에 훨씬 가깝다는 것이다. 그러나, 보정 정보의 엔트로피는 보정 위상 정보 자체의 엔트로피보다 낮다. 따라서, 파라미터 비트 레이트는 인코더에서 획득되는 위상을 직접 전송하는 것과 비교할 때 낮아진다.
또 다른 실시 예에서, 위상 정보/기간들은 디코더 내의 (슈도) 랜덤 과정으로부터 획득된다. 그러한 접근법의 장점은 높은 공간 해상도를 갖는 어떤 위상 정보도 전송할 필요가 없다는 것이다. 이는 감소된 데이터 레이트를 야기한다. 일 실시 예에서, 간단한 방법은 범위 [-180o, 180o] 내의 균일한 랜덤 분포를 갖는 위상 값들을 발생시키는 것이다.
또 다른 실시 예에서, 인코더 내의 위상 분포이 통계 특성들이 측정되낟. 이러한 특성들은 코딩되고 그리고 나서 디코더로 전송된다(낮은 시간 해상도에서). 랜덤 위상 값들은 전송된 통계 특성들이 필요한 디코더 내에서 발생된다. 이러한 특성들은 평균, 변형, 또는 통계 위상 분포의 다른 통계 측정들일 수 있다.
하나 이상의 역상관기 인스턴스(instance)가 병렬로 실행될 때, 상호 역상관되는 역상관기 출력들을 보장하기 위하여 주의가 요구된다. 일 실시 예에서, (슈도) 랜덤 위상 값들의 다중 벡터들(단일 벡터 대신에)이 거의 제 1 역상관기 인스턴스를 위하여 발생되고, 모든 역상관기 인스턴스에 걸쳐 위상 값의 최소의 상관관계를 야기하는 일련의 벡터들이 선택된다.
인코더로부터 디코더로 위상 보정 정보를 전송하는 경우에 있어서, 필요로 하는 데이터 레이트는 다음과 같이 감소될 수 있다.
위상 보정 정보는 단지 역상관되는 신호 내의 트랜지언트 성분들이 존재하는 한 디코더 내에서 이용할 수 있도록 하기 위하여 필요하다. 위상 보정 정보의 전송은 따라서 필요한 정보만이 디코더로 전송되는 것과 같이 인코더에 의해 제한될 수 있다. 이는 위에서 설명된 것과 같이 인코더에서 트랜지언트 검출을 적용함으로써 수행될 수 있다. 위상 보정 정보는 트랜지언트들이 인코더 내에서 검출되었던, 어떤 시점에서만 전송된다.
트랜지언트 분리의 양상으로 돌아가면, 일 실시 예에서, 트랜지언트 분리는 디코더 중심일 수 있다.
그러한 실시 예에서, 트랜지언트 분리 정보는 예를 들면, Andreas Walther, Christian Uhlele, sascha Disch의 "Using Transient supression in Blind Multi-channel Up-mix Algorithms", Proc. 112nd AES Convention, vienna, Austria, May 2007에서 설명된 것과 같은 트랜지언트 검출 방법을 스테레오 또는 다중채널 출력 신호로 업믹싱하기 전에 공간 오디오 디코더에서 이용가능한 다운믹스 신호에 적용함으로써, 디코더 내에서 획득될 수 있다. 이 경우에 있어서, 어떤 트랜지언트 정보도 전송되어서는 안 되는데, 이는 전송 데이터 레이트를 절약할 수 있다.
그러나, 디코딩에서의 트랜지언트 검출의 실행은 예를 들면, 트랜지언트 처리 방법을 표준화할 때 문제들을 야기하는데, 예를 들면, 서로 다른 수치 정밀도들을 포함하는 서로 다른 아키텍쳐(architecture)들/플랫폼들 상에 구현될 때 정확하게 동일한 트랜지언트 검출 결과를 야기하는 트랜지언트 검출 알고리즘을 발견하는 것이 어려울 수 있다. 그러한 예상가능한 디코더 행동은 종종 표준화에 필수적이다. 게다가, 표준화된 트랜지언트 검출 알고리즘은 일부 입력 신호들을 위하여 실패할 수 있는데, 이는 출력 신호들 내의 허용할 수 없는 왜곡들을 야기한다. 그때 표준에 따르지 않는 디코더를 설립하지 않고 표준화 후에 실패한 알고리즘을 보정하는 것은 어려울 수 있다. 이러한 문제는 만일 적어도 하나의 파라미터가 인코더로부터 디코더로 낮은 시간 해상도에서(예를 들면, MPEG 서라운드의 공간 파라미터 업데이트 레이트에서) 전송되면 덜 심각하다.
또 다른 실시 예에서, 트랜지언트 분리는 또한 디코더 중심이고 비-전대역 잔여들이 전송된다. 이러한 실시 예에서, 디코더 중심 트랜지언트 분리는 전송된 비-전대역 잔여들로부터 획득된 위상 평가들을 사용함으로써(위를 참조) 개선될 수 있다. 이러한 개선은 인코더로부터 디코더로 부가적인 데이터의 전송 없이 디코더에서 적용될 수 있다는 것을 이해하여야 한다.
이러한 실시 예에서, 트랜지언트 역상관기 내에 적용되는 위상 기간들은 잔여 대역들로부터 잔여들을 이용할 수 없는 주파수들로 정확한 위상 값들을 추정함으로써 획득된다. 하나의 방법은 잔여 신호들이 이용가능한 주파수들를 위하여 계산될 수 있는 위상 값들로부터 (잠재적으로 예를 들면, 신호 전력 가중치의) 평균 위상 값을 계산하는 것이다. 평균 위상 값은 그리고 나서 트랜지언트 역상관기 내의 주파수 독립 파라미터로서 적용될 수 있다.
다운믹스 및 잔여 사이의 정확한 위상 관계가 주파수 독립적인 한, 평균 위상 값은 정확한 위상 값의 뛰어난 평가를 표현한다. 그러나, 주파수 축을 따라 위상 관계가 일정하지 않은 경우에 있어서, 평균 위상 값은 잠재적으로 부정확한 위상 값들 및 가청 아티팩트들에 이르게 하는, 덜 정확한 평가일 수 있다.
다운믹스 및 전송된 잔여 사이의 위상 관계의 일관성은 따라서 트랜지언트 역상관기에 적용되는 추정된 위상 평가의 신뢰도 측정으로서 사용될 수 있다. 가청 아티팩트들의 위험을 낮추기 위하여, 디코더에서 획득되는 일관성 측정은 예를 들면 다음과 같이 디코더 내의 트랜지언트 분리 강도를 제어하도록 사용될 수 있다.
상응하는 위상 정보(즉, 동일한 시간 지수(n)를 위한 위상 정보)가 주파수를 따라 일정한, 트랜지언트들은 종래의 역상관기 입력으로부터 완전히 분리되고 트랜지언트 역상관기 내로 완전히 제공된다. 큰 위상 평가 에러들은 있을 수 없기 때문에, 트랜지언트 처리의 모든 가능성이 사용된다.
상응하는 위상 정보가 주파수를 따라 덜 일정한, 트랜지언트들은 부분적으로만 분리되는데, 이는 트랜지언트 처리 방법의 덜 중요한 효과에 이르게 한다.
상응하는 위상 정보가 주파수를 따라 매우 불일치하는, 트랜지언트들은 분리되지 않는데, 이는 제안된 트랜지언트 처리 없이 종래의 업믹스 시스템의 표준 행동에 이르게 한다. 따라서, 큰 위상 평가 에러에 기인하는 어떤 아티팩트들도 발생할 수 없다.
위상 정보를 위한 일관성 측정은 예를 들면, 주파수를 따라 위상 정보의 표준 편차의 (잠재적으로 신호 전력이 가중된) 분산으로부터 감해질 수 있다.
단지 소수의 주파수만이 이용가능할 수 있기 때문에, 일관성 측정은 주파수를 따라 단지 소수의 샘플들로부터 평가되어야만 할 수 있는데, 이는 거의 최대 값들(완벽하게 일정한" 또는 "완벽하게 불일치하는")에 도달할 수 없는 일관성 측정에 이르게 한다. 따라서, 일관성 측정은 트랜지언트 분리 강도를 제어하도록 사용되기 전에 선형으로 또는 비-선형으로 왜곡될 수 있다. 일 실시 예에서, 한계(threshold) 특성은 도 8의, 오른쪽 실시 예에서 도시된 것과 같이 구현된다.
도 8은 트랜지언트 처리 파라미터들을 획득하기 위한 변형들의 트랜지언트 오분류에 대한 강건성(robustness)에 대한 영향을 나타내는, 위상 일관성 측정들로부터 트랜지언트 분리 강도들로의 서로 다른 바람직한 매핑을 도시한다. 위에서 열거된 트랜지언트 분리 정보 및 위상 정보를 획득하기 위한 변형들은 파라미터 데이터 레이트에서 서로 다르고 따라서 제안된 트랜지언트 처리 기술을 구현하는 코덱의 전체 비트 레이트에 대하여 서로 다른 동작점을 나타낸다. 이와는 별도로, 위상 정보를 획득하기 위한 소스의 선택은 또한 거짓(false) 트랜지언트 분류와 같은 양상들에 영향을 미친다. 만일 정확한 위상 정보가 트랜지언트 처리에 적용되면 트랜지언트로서 비-트랜지언트 신호의 처리는 훨씬 덜한 가청 왜곡을 야기한다. 따라서, 신호 분류 에러는 디코더 내이 랜덤 위상 발생의 시나리오와 비교할 때 전송된 위상 값들의 시나리오에서 덜 심각한 아티팩트들을 야기한다.
도 9는 또 다른 실시 예에 따른 트랜지언트 처리를 갖는 1-대-2 시스템 개요인데, 협대역 잔여 신호들이 전송된다. 위상 데이터(△φ) 잔여 신호의 주파수 대역(들) 내의 다운믹스(DMX) 및 잔여 신호 사이의 위상 관계로부터 평가된다. 선택적으로, 위상 평가 에러를 낮추기 위하여 위상 보정 데이터가 전송된다.
도 9는 각각 도 5의 실시 예의 트랜지언트 분리기(510), 트랜지언트 역상관기(520), 격자 무한 임펄스 응답 역상관기(530), 결합 유닛(540), 믹서(552), 선택적 형상 유닛(554), 제 1 가산 유닛(556) 및 제 2 가산 유닛(558)과 상응하는, 트랜지언트 분리기(910), 트랜지언트 역상관기(920), 격자 무한 임펄스 응답 역상관기(930), 결합 유닛(940), 믹서(952), 선택적 형상 유닛(954), 제 1 가산 유닛(956) 및 제 2 가산 유닛(958)을 도시한다. 도 8의 실시 예는 또한 위상 평가 유닛(phase estimation unit, 960)을 포함한다. 위상 평가 유닛(960)은 입력 신호(DMX), 잔여 신호 및 선택적으로, 위상 보정 데이터를 포함한다. 수신된 정보를 기초로 하여 위상 정보 유닛은 위상 데이터(△φ)를 계산한다. 선택적으로, 위상 평가 유닛은 또한 위상 일관성 정보를 결정하고 위상 일관성 정보를 트랜지언트 분리기(910)로 넘긴다. 예를 들면, 위상 일관성 정보는 트랜지언트 분리 강도를 제어하기 위하여 트랜지언트 분리기에 의해 사용될 수 있다.
도 9이 실시 예는 만일 잔여들이 비-전대역 방식으로 코딩 방법 내로 전송되면, 잔여 및 다운믹스(△φresidual _ bands) 사이의 신호 전력 가중치 평균 위상 차이가 광대역 위상 정보로서 분리된 트랜지언트들(△φ=△φlow residual _ bands)에 적용될 수 있다는 사실을 적용한다. 이 경우에 있어서, 어떤 부가적인 위상 정보도 전송되어서는 안 되는데, 이는 트랜지언트 처리를 위한 비트 레이트 요구를 낮춘다. 도 9의 실시 예에서, 잔여 대역들로부터의 위상 평가는 인코더에서 이용가능한 더 정확한 광대역 위상 평가로부터 상당히 벗어날 수 있다. 따라서 하나의 선택은 디코더에서 정확한 △φ를 이용가능하도록 하기 위하여 위상 보정 데이터(예를 들면, △φcorrection △φ-△φlow residual _ bands)를 전송하는 것이다. 그러나, △φcorrection은 △φ보다 낮은 엔트로피를 나타내기 때문에, 필요한 파라미터 데이터 레이트는 △φ를 전송하기 위하여 필요할 수 있는 레이트보다 낮을 수 있다(이러한 개념은 코딩에서의 예측의 일반적인 사용과 유사하다. 데이터를 직접 코딩하는 대신에, 낮은 엔트로피를 갖는 예측 에러가 코딩된다. 도 9의 실시 예에서, 예측 단계는 잔여 주파수 대역들로부터 비-잔여 대역들로의 위상의 추정이다). 주파수 축을 따라 잔여 주파수 대역들(△φlow residual _ bands)에서의 위상 차이의 일관성은 트랜지언트 분리 강도를 제어하도록 사용될 수 있다.
실시 예들에서, 디코더는 인코더로부터 위상 정보를 수신할 수 있거나, 또는 디코더는 위상 정보를 자체로 결정할 수 있다. 게다가, 디코더는 인코더로부터 트랜지언트 분리 정보를 수신할 수 있거나, 또는 디코더는 트랜지언트 분리 정보를 자체로 결정할 수 있다.
실시 예들에서, 트랜지언트 처리의 양상은 입력을 위상 기간들에 곱한 것을 기초로 하는, "트랜지언트 역상관기"와 함께 국제특허 제 WO/2010/0107967에서 설명된 "의미론적 역상관"의 적용이다. 제공되는 박수 유사 신호들의 지각 품질은 개선되는데 그 이유는 처리 단계들 모두 트랜지언트 신호들의 공간 구조의 변경을 방지하기 때문이다. 게다가, 트랜지언트들의 공간 분포뿐만 아니라 트랜지언트들 사이의 위상 관계들이 출력 채널들에서 재구성된다. 게다가, 실시 예들은 또한 계산상으로 효율적이고 파라메트릭 스테레오 또는 MPEG 서라운드 유사 업믹스 시스템들 내로 쉽게 통합될 수 있다. 실시 예들에서, 트랜지언트 처리는 믹싱 매트릭스 과정에 영향을 미치지 않으며, 따라서 믹싱 매트릭스에 의해 정의되는 모든 공간 렌더링 특성들이 또한 트랜지언트 신호에 적용될 수 있다.
실시 예들에서, 특히 파라메트릭 스테레오 또는 MPEG 서라운드와 같은 공간 오디오 코딩 방법의 적용에 적합하고 박수-유사 신호들, 즉, 공간적으로 분포되는 트랜지언트들의 밀집한 혼합체를 포함하는 신호들의 경우에 출력 신호들의 지각 품질을 향상시키거나 및/또는 포괄적인 "의미론적 역상관" 프레임워크의 향상된 구현으로서 보일 수 있는, 업믹스 시스템들에서의 적용을 위하여 특히 적합한, 신규의 역상관 방법이 적용된다. 게다가, 실시 예들에서 원래의 신호에서의 분포와 유사한 트랜지언트들의 공간/시간 분포를 재구성하고, 트랜지언트 신호들의 시간 구성을 보존하며, 비트 레이트 대 품질 균형의 변경을 허용하거나 및/또는 비-전대역 잔여들 또는 도입된 엔벨로프 형상과 같은 MPEG 서라운드 특성들과의 조합에 이상적으로 적합한, 신규 역상관 방법이 포함된다. 조합들은 상보적인데, 즉, 트랜지언트 처리를 위하여 표준 MPEG 서라운드 특성들의 정보가 재사용된다.
도 10은 복수의 채널을 갖는 오디오 신호를 인코딩하기 위한 장치를 도시한다. 두 개의 입력 채널(L, R)은 다운믹서(downmixer, 1010) 및 잔여 신호 계산기(1020) 내로 제공된다. 다른 실시 예들에서, 복수의 채널, 예를 들면, 3, 5, 또는 9 서라운드 채널들은 다운믹서(downmixer, 1010) 및 잔여 신호 계산기(1020) 내로 제공된다. 다운믹서(1010)는 그리고 나서 다운믹스 신호를 획득하기 위하여 두 개의 채널(L, R)을 다운믹스한다. 예를 들면, 다운믹서(1010)는 믹싱 매트릭스를 사용할 수 있으며 다운믹스 신호를 획득하기 위하여 믹싱 매트릭스 및 두 개의 입력 채널(L, R)의 매트릭스 곱셈을 수행한다. 다운믹스 신호는 디코더로 전송될 수 있다.
게다가, 잔여 신호 계산기(1020)는 잔여 신호로서 언급되는 또 다른 신호를 계산하도록 적용된다. 잔여 신호들은 부가적으로 다운믹스 신호 및 업믹스 매트릭스를 사용함으로써 원래의 신호들을 재발생시키도록 사용될 수 있다. 예를 들면, N 신호들이 1개의 신호로 다운믹스될 때, 다운믹스는 일반적으로 N 입력 신호들의 매핑으로부터 야기되는 N 성분들 중의 1이다. 매핑으로부터 야기되는 나머지 성분들(예를 들면, N-1 성분들)은 잔여 신호들이며 역 매핑에 의해 원래의 N 신호들의 재구성을 허용한다. 매핑은 예를 들면, 회전일 수 있다. 매핑은 예를 들면, 주요 축 변환과 유사하데, 다운믹스 신호가 최대화되고 잔여 신호가 최소화되는 것과 같이 수행되어야 한다. 예를 들면, 다운믹스 신호의 에너지는 최대화되어야만 하며 잔여 신호들의 에너지는 최소화되어야만 한다. 2개의 신호를 1개의 신호로 다운믹스할 때, 다운믹스는 정상적으로 2개의 입력 신호들의 매핑으로부터 야기되는 두 개의 성분 중의 하나이다. 매핑으로부터 야기되는 나머지 성분은 잔여 신호이며 역 매핑에 의해 원래의 두 개의 신호의 재구성을 허용한다.
일부 경우에 있어서, 잔여 신호는 그것들의 다운믹스 및 관련 파라미터들에 의한 두 개의 신호의 표현과 관련된 에러를 표현할 수 있다. 예를 들면, 잔여 신호는 원래의 채널들(L, R) 및 원래의 채널들(L 및 R)을 기초로 한 다운믹스 신호를 업믹스함으로써 생기는 채널들(L', R') 사이의 에러를 표현하는 에러 신호일 수 있다.
바꾸어 말하면, 잔여 신호는 다운믹스 신호와 함께 또는 다운믹스 신호 및 파라메트릭 정보와 함께 원래의 채널의 정확하거나 또는 거의 정확한 재구성을 허용하는, 시간 도메인 또는 주파수 도메인 또는 부대역 도메인 내의 신호로서 고려될 수 있다. 거의 정확하다는 것은 제로보다 큰 에너지를 갖는 잔여 신호로의 재구성이 잔여 신호 없이 다운믹스를 사용하거나 또는 잔여 신호 없이 다운믹스와 파라메트릭 정보를 사용하는 재구성과 비교하여 원래의 채널에 더 가까운 것으로 이해되어야 한다.
게다가 인코더는 위상 정보 계산기(1030)를 포함한다. 다운믹스 신호 및 잔여 신호는 위상 정보 계산기(1030) 내로 제공된다. 위상 정보 계산기는 그리고 나서 위상 정보를 획득하기 위하여 다운믹스 및 잔여 신호 사이의 위상 차이 상에서 위상 정보를 계산한다. 예를 들면, 위상 정보 계산기는 다운믹스 및 잔여 신호의 교차 상관을 계산하는 함수들을 적용할 수 있다.
게다가, 인코더는 출력 발생기(1040)를 포함한다. 위상 정보 계산기(1030)에 의해 발생된 위상 정보는 출력 발생기(1040) 내로 제공된다. 출력 발생기(1040)는 그리고 나서 위상 정보를 출력한다.
일 실시 예에서 장치는 위상 정보를 양자화하기 위한 위상 정보 양자화기를 더 포함한다. 위상 정보 계산기에 의해 발생된 위상 정보는 위상 정보 양자화기 내로 제공될 수 있다. 위상 정보 양자화기는 그리고 나서 위상 정보를 양자화한다. 예를 듬련, 위상 정보는 8개의 서로 다른 값들, 예를 들면 0, 1, 2, 3, 4, 5, 6, 또는 7 중의 하나로 매핑될 수 있다. 값들은 각각 위상 차이들 0, π/4, π/2, 3π/4, π, 5π/4, 3π/2 및 7π/4를 표현할 수 있다. 양자화된 위상 정보는 그리고 나서 출력 발생기(1040) 내로 제공될 수 있다.
또 다른 실시 예에서, 장치는 또한 무손실 인코더를 포함한다. 위상 정보 계산기(1040)로부터 위상 정보 또는 위상 정보 양자화기로부터 양자화된 위상 정보는 손실없는 인코더 내로 제공될 수 있다. 무손실 인코더는 무손실 인코딩을 적용함으로써 위상 정보를 인코딩하도록 적용된다. 모든 종류의 무손실 코딩 방법이 사용될 수 있다. 예를 들면, 인코더는 산술 코딩을 사용할 수 있다. 예를 들면, 인코더는 그리고 나서 손실 없이 인코딩된 위상 정보를 출력 발생기(1040) 내로 제공한다.
설명된 실시 예들의 디코더와 인코더 및 방법과 관련하여 다음의 내용이 언급된다.
특정 구현 필요성에 따라, 본 발명의 실시 예들은 하드웨어 도는 소프트웨어에서 구현될 수 있다. 구현은 디지털 저장 매체, 예를 들면, 각각의 방법이 실행되는 것과 같은 프로그램작동이 가능한 컴퓨터 시스템과 함께 협력하는(또는 협력할 수 있는), 거기에 저장되는 전자적으로 판독가능한 제어 신호들을 갖는, 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 플래시(FLASH) 메모리를 사용하여 구현될 수 있다.
본 발명에 따른 일부 실시 예들은 여기에 설명된 방법들 중의 하나가 실행되는 것과 같이, 프로그램작동이 가능한 컴퓨터 시스템과 함께 협력할 수 있는, 전자적으로 판독가능한 제어 신호들을 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시 예들은 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있는데, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터상에서 구동할 때 방법들 중의 하나를 실행하기 위하여 작동할 수 있다. 프로그램 코드는 예를 들면 기계 판독가능한 캐리어 상에 저장될 수 있다.
다른 실시 예들은 기계 판독가능한 캐리어 상에 저장되는, 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램을 포함한다.
바꾸어 말하면, 본 발명의 방법의 일 실시 예는 따라서, 컴퓨터 프로그램이 컴퓨터상에서 구동할 때, 여기에 설명된 방법들 중의 하나를 실행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
본 발명의 방법의 또 다른 실시 예는 따라서, 거기에 기록되는, 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램을 포함하는 데이터 캐리어(또는 디지털 저장 매체 또는 컴퓨터 판독가능 매체)이다.
본 발명의 방법의 또 다른 실시 예는 따라서, 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램을 표현하는 데이터 스트림 또는 신호들의 시퀀스이다. 데이터 스트림 또는 신호들의 시퀀스는 예를 들면 데이터 통신 연결, 예를 들면 인터넷을 거쳐 전달되도록 구성될 수 있다.
또 다른 실시 예는 그 안에 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
일부 실시 예들에서, 여기에 설명된 방법들 중 일부 또는 모두를 실행하기 위하여 프로그램작동이 가능한 논리 장치(예를 들면, 필드 프로그램작동 가능 게이트 배열(field programmable gate array))이 사용될 수 있다. 일부 실시 예들에서, 필드 프로그램작동 가능 게이트 배열은 여기에 설명된 방법들 중의 하나를 실행하기 위하여 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 바람직하게는 모든 하드웨어장치에 의해 실행된다.
위에서 설명된 예들은 단지 본 발명의 원리를 위한 설명들이다. 통상의 지식을 가진 자들에게 여기에 설명된 배치들 및 세부사항의 변형 및 변경들은 자명할 것이다. 따라서, 이는 여기에 설명된 실시 예들의 설명에 의해 나타낸 특정 세부내용에 의해서가 아니라 첨부된 특허 청구항의 범위에 위해서만 한정되는 것으로 의도되어야 한다.
110 : 역상관기
120 : 믹서
210 : 분석 필터뱅크
220 : 역상관기
230 : 믹싱 매트릭스
240 : 파라미터 변형 유닛
250 : 파라미터 제어 유닛
310 : 트랜지언트 분리기
320 : 트랜지언트 역상관기
330 : 종래의 역상관기
340 : 결합 유닛
410 : 트랜지언트 분리기
420 : 트랜지언트 역상관기
430 : 종래의 역상관기
440 : 결합 유닛
450 : 믹서
510 : 트랜지언트 분리기
520 : 트랜지언트 역상관기
530 : 격자 무한 임펄스 응답 역상관기
552 : 믹서
554 : 형상 유닛
556 : 제 1 가산 유닛
558 : 제 2 가산 유닛
610 : 트랜지언트 분리기
620 : 트랜지언트 역상관기
630 : 종래의 역상관기
640 : 결합 유닛
650 : 수신 유닛
710 : 트랜지언트 분리기
720 : 트랜지언트 역상관기
730 : 격자 무한 임펄스 응답 역상관기
740 : 결합 유닛
752 : 믹서
910 : 트랜지언트 분리기
920 : 트랜지언트 역상관기
930 : 격자 무한 임펄스 응답 역상관기
940 : 결합 유닛
952 : 믹서
954 : 형상 유닛
956 : 제 1 가산 유닛
958 : 제 2 가산 유닛
960 : 위상 평가 유닛
1010 : 다운믹서
1020 : 잔여 신호 계산기
1030 : 위상 정보 계산기
1040 : 출력 발생기
120 : 믹서
210 : 분석 필터뱅크
220 : 역상관기
230 : 믹싱 매트릭스
240 : 파라미터 변형 유닛
250 : 파라미터 제어 유닛
310 : 트랜지언트 분리기
320 : 트랜지언트 역상관기
330 : 종래의 역상관기
340 : 결합 유닛
410 : 트랜지언트 분리기
420 : 트랜지언트 역상관기
430 : 종래의 역상관기
440 : 결합 유닛
450 : 믹서
510 : 트랜지언트 분리기
520 : 트랜지언트 역상관기
530 : 격자 무한 임펄스 응답 역상관기
552 : 믹서
554 : 형상 유닛
556 : 제 1 가산 유닛
558 : 제 2 가산 유닛
610 : 트랜지언트 분리기
620 : 트랜지언트 역상관기
630 : 종래의 역상관기
640 : 결합 유닛
650 : 수신 유닛
710 : 트랜지언트 분리기
720 : 트랜지언트 역상관기
730 : 격자 무한 임펄스 응답 역상관기
740 : 결합 유닛
752 : 믹서
910 : 트랜지언트 분리기
920 : 트랜지언트 역상관기
930 : 격자 무한 임펄스 응답 역상관기
940 : 결합 유닛
952 : 믹서
954 : 형상 유닛
956 : 제 1 가산 유닛
958 : 제 2 가산 유닛
960 : 위상 평가 유닛
1010 : 다운믹서
1020 : 잔여 신호 계산기
1030 : 위상 정보 계산기
1040 : 출력 발생기
Claims (14)
- 제 1 신호 성분이 입력 신호의 트랜지언트 신호 부들을 포함하고 제 2 신호 성분이 상기 입력 신호의 비-트랜지언트 신호 부들을 포함하도록, 장치 입력 신호를 상기 제 1 신호 성분 및 상기 제 2 신호 성분으로 분리하는 트랜지언트 분리기(310; 410; 510; 610; 710; 910);
제 1 역상관된 신호 성분을 획득하기 위하여 제 1 역상관 방법에 따라 상기 제 1 신호 성분을 역상관시키는 트랜지언트 역상관기(320; 420; 520; 620; 720; 920);
제 2 역상관된 신호 성분을 획득하기 위하여 상기 제 1 역상관 방법과는 다른 제 2 역상관 방법에 따라 상기 제 2 신호 성분을 역상관시키는 또 다른 제 2 역상관기(330; 430; 530; 630; 730; 930);
역상관된 결합 신호를 획득하기 위하여 상기 제 1 역상관된 신호 성분 및 상기 제 2 역상관된 신호 성분을 결합시키는 결합 유닛(340; 440; 540; 640; 740; 940); 및
믹서 입력 신호들을 수신하도록 적용되고 상기 믹서 입력 신호들 및 믹싱 룰을 기초로 하여 출력 신호들을 발생시키도록 적용되는 믹서(450; 552; 752; 952);를 포함하되,
상기 결합 유닛(340; 440; 540; 640; 740; 940) 및 믹서(450; 552; 752; 952)는 상기 역상관된 조합 신호가 제 1 믹서 입력 신호로서 상기 믹서(450; 552; 752; 952) 내로 제공되고 상기 장치 입력 신호 또는 상기 장치 입력 신호로부터 유래된 신호는 제 2 믹서 입력 신호로서 상기 믹서(450; 552; 752; 952) 내로 제공되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 믹서(450; 552; 752; 952)는 또한 두 개의 신호들 사이의 상관관계 또는 간섭성을 나타내는 상관관계/간섭성 파라미터 데이터를 수신하도록 적용되고 상기 믹서(450; 552; 752; 952)는 또한 상기 상관관계/간섭성 파라미터 데이터를 기초로 하여 상기 출력 신호들을 발생시키도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 믹서(450; 552; 752; 952)는 또한 두 개의 신호들 사이의 에너지 차이를 나타내는 레벨 차이 파라미터 데이터를 수신하도록 적용되고 상기 믹서(450; 552; 752; 952)는 또한 상기 레벨 차이 파라미터 데이터를 기초로 하여 상기 출력 신호들을 발생시키도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 믹서(450; 552; 752; 952)는 믹싱 매트릭스에 의해 상기 제 1 및 제 2 믹서 입력 신호를 곱하는 룰을 포함하는 믹싱 룰을 사용하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 결합 유닛(340; 440; 540; 640; 740; 940)은 상기 제 1 역상관된 신호 성분 및 상기 제 2 역상관된 신호 성분을 더함으로써 상기 제 1 역상관된 신호 성분 및 상기 제 2 역상관된 신호 성분을 결합하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 고려되는 신호 부가 트랜지언트를 포함하는 것을 나타내거나 또는 상기 고려되는 신호 부가 트랜지언트를 포함하지 않는 것을 나타내는 트랜지언트 분리 정보에 따라 상기 장치 입력 신호의 상기 고려되는 신호 부를 상기 트랜지언트 역상관기(320; 420; 520; 620; 720; 920) 내로 제공하거나 또는 상기 고려되는 신호 부를 상기 제 2 역상관기(330; 430; 530; 630; 730; 930) 내로 제공하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 상기 장치 입력 신호의 고려되는 신호 부를 상기 트랜지언트 역상관기(320; 420; 520; 620; 720; 920) 내로 부분적으로 제공하고 상기 고려되는 신호 부를 상기 제 2 역상관기(330; 430; 530; 630; 730; 930) 내로 부분적으로 제공하며, 상기 트랜지언트 분리기 내로 제공되는 상기 고려되는 신호 부의 양 및 상기 제 2 역상관기 내로 제공되는 상기 고려되는 신호 부의 양은 트랜지언트 분리 정보에 의존하는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 주파수 도메인 내에서 표현되는 장치 입력 신호를 분리하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 주파수 독립 트랜지언트 분리 정보에 따라 상기 장치 입력 신호를 제 1 신호 성분 및 제 2 신호 성분으로 분리하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 트랜지언트 분리기(310; 410; 510; 610; 710; 910)는 주파수 의존 트랜지언트 분리 정보에 따라 상기 장치 입력 신호를 제 1 신호 성분 및 제 2 신호 성분으로 분리하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 장치는 인코더로부터 위상 정보를 수신하도록 적용되는 수신 유닛(650)을 더 포함하며, 상기 트랜지언트 역상관기(320; 420; 520; 620; 720; 920)는 상기 인코더로부터의 상기 위상 정보를 상기 제 1 신호 성분에 적용하도록 적용되는 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1항에 있어서,
상기 제 2 역상관기(330; 430; 530; 630; 730; 930)는 격자 무한 임펄스 응답 역상관기인 것을 특징으로 하는 신호를 디코딩하기 위한 장치.
- 제 1 신호 성분이 장치 입력 신호의 트랜지언트 신호 부들을 포함하고 제 2 신호 성분이 상기 장치 입력 신호의 비-트랜지언트 신호 부들을 포함하는 것과 같이 상기 장치 압력 신호를 상기 제 1 신호 성분 및 상기 제 2 신호 성분으로 분리하는 단계;
제 1 역상관된 신호 성분을 획득하기 위하여 제 1 역상관 방법에 따라 트랜지언트 역상관기에 의해 상기 제 1 신호 성분을 역상관시키는 단계;
제 2 역상관된 신호 성분을 획득하기 위하여 상기 제 1 역상관 방법과는 다른 제 2 역상관 방법에 따라 또 다른 제 2 역상관기에 의해 상기 제 2 신호 성분을 역상관시키는 단계;
역상관된 결합 신호를 획득하기 위하여 상기 제 1 역상관된 신호 성분 및 상기 제 2 역상관된 신호 성분을 결합하는 단계; 및
믹싱 룰, 상기 역상관된 조합 신호 및 상기 장치 입력 신호를 기초로 하여 출력 신호들을 발생시키는 단계;를 포함하는 것을 특징으로 하는 신호를 디코딩하기 위한 방법.
- 제 13항에 따른 방법을 구현하는 컴퓨터 프로그램이 저장된 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37698010P | 2010-08-25 | 2010-08-25 | |
US61/376,980 | 2010-08-25 | ||
PCT/EP2011/061360 WO2012025282A1 (en) | 2010-08-25 | 2011-07-06 | Apparatus for decoding a signal comprising transients using a combining unit and a mixer |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130079507A KR20130079507A (ko) | 2013-07-10 |
KR101445291B1 true KR101445291B1 (ko) | 2014-09-29 |
Family
ID=44509236
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137007137A KR101445293B1 (ko) | 2010-08-25 | 2011-07-06 | 전송된 위상 정보를 사용하여 역상관된 신호를 발생시키기 위한 장치 |
KR1020137007136A KR101445291B1 (ko) | 2010-08-25 | 2011-07-06 | 결합 유닛 및 믹서를 사용하여 트랜지언트들을 포함하는 신호를 디코딩하기 위한 장치 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137007137A KR101445293B1 (ko) | 2010-08-25 | 2011-07-06 | 전송된 위상 정보를 사용하여 역상관된 신호를 발생시키기 위한 장치 |
Country Status (21)
Country | Link |
---|---|
US (3) | US9431019B2 (ko) |
EP (5) | EP2609590B1 (ko) |
JP (3) | JP5775582B2 (ko) |
KR (2) | KR101445293B1 (ko) |
CN (2) | CN103460282B (ko) |
AR (3) | AR082543A1 (ko) |
AU (2) | AU2011295367B2 (ko) |
BR (2) | BR112013004362B1 (ko) |
CA (3) | CA2887939C (ko) |
ES (3) | ES2585402T3 (ko) |
HK (2) | HK1186833A1 (ko) |
MX (2) | MX2013002188A (ko) |
MY (3) | MY178197A (ko) |
PL (3) | PL3144932T3 (ko) |
PT (2) | PT2609591T (ko) |
RU (3) | RU2573774C2 (ko) |
SG (3) | SG187950A1 (ko) |
TR (1) | TR201900417T4 (ko) |
TW (2) | TWI459380B (ko) |
WO (2) | WO2012025282A1 (ko) |
ZA (1) | ZA201302050B (ko) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112013004362B1 (pt) * | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
EP2612321B1 (en) * | 2010-09-28 | 2016-01-06 | Huawei Technologies Co., Ltd. | Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal |
US9064318B2 (en) | 2012-10-25 | 2015-06-23 | Adobe Systems Incorporated | Image matting and alpha value techniques |
US10638221B2 (en) | 2012-11-13 | 2020-04-28 | Adobe Inc. | Time interval sound alignment |
US9355649B2 (en) * | 2012-11-13 | 2016-05-31 | Adobe Systems Incorporated | Sound alignment using timing information |
US9201580B2 (en) | 2012-11-13 | 2015-12-01 | Adobe Systems Incorporated | Sound alignment user interface |
US9076205B2 (en) | 2012-11-19 | 2015-07-07 | Adobe Systems Incorporated | Edge direction and curve based image de-blurring |
US10249321B2 (en) | 2012-11-20 | 2019-04-02 | Adobe Inc. | Sound rate modification |
US9451304B2 (en) | 2012-11-29 | 2016-09-20 | Adobe Systems Incorporated | Sound feature priority alignment |
US10455219B2 (en) | 2012-11-30 | 2019-10-22 | Adobe Inc. | Stereo correspondence and depth sensors |
US9135710B2 (en) | 2012-11-30 | 2015-09-15 | Adobe Systems Incorporated | Depth map stereo correspondence techniques |
US9208547B2 (en) | 2012-12-19 | 2015-12-08 | Adobe Systems Incorporated | Stereo correspondence smoothness tool |
US10249052B2 (en) | 2012-12-19 | 2019-04-02 | Adobe Systems Incorporated | Stereo correspondence model fitting |
US9214026B2 (en) | 2012-12-20 | 2015-12-15 | Adobe Systems Incorporated | Belief propagation and affinity measures |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
WO2014126689A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for controlling the inter-channel coherence of upmixed audio signals |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
WO2014174344A1 (en) * | 2013-04-26 | 2014-10-30 | Nokia Corporation | Audio signal encoder |
EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830333A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
SG11201600466PA (en) | 2013-07-22 | 2016-02-26 | Fraunhofer Ges Forschung | Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals |
JP6242489B2 (ja) * | 2013-07-29 | 2017-12-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
WO2015036350A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
KR101805327B1 (ko) * | 2013-10-21 | 2017-12-05 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조 |
KR102231755B1 (ko) | 2013-10-25 | 2021-03-24 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
WO2015104447A1 (en) | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
EP2980789A1 (en) | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
KR20160101692A (ko) | 2015-02-17 | 2016-08-25 | 한국전자통신연구원 | 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치 |
US11234072B2 (en) | 2016-02-18 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Processing of microphone signals for spatial playback |
TWI616095B (zh) * | 2016-08-26 | 2018-02-21 | 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式 | |
CA3045847C (en) | 2016-11-08 | 2021-06-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder |
EP3539126B1 (en) | 2016-11-08 | 2020-09-30 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
CN110998722B (zh) | 2017-07-03 | 2023-11-10 | 杜比国际公司 | 低复杂性密集瞬态事件检测和译码 |
ES2965741T3 (es) | 2017-07-28 | 2024-04-16 | Fraunhofer Ges Forschung | Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha |
US10306391B1 (en) | 2017-12-18 | 2019-05-28 | Apple Inc. | Stereophonic to monophonic down-mixing |
EP3550561A1 (en) | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
MX2021007109A (es) * | 2018-12-20 | 2021-08-11 | Ericsson Telefon Ab L M | Metodo y aparato para controlar el ocultamiento de perdida de tramas de audio multicanal. |
FR3136099A1 (fr) * | 2022-05-30 | 2023-12-01 | Orange | Codage audio spatialisé avec adaptation d’un traitement de décorrélation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070140499A1 (en) | 2004-03-01 | 2007-06-21 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999041947A1 (en) * | 1998-02-13 | 1999-08-19 | Koninklijke Philips Electronics N.V. | Surround sound reproduction system, sound/visual reproduction system, surround signal processing unit and method for processing an input surround signal |
BR0304231A (pt) | 2002-04-10 | 2004-07-27 | Koninkl Philips Electronics Nv | Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US20090299756A1 (en) | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
WO2007109338A1 (en) * | 2006-03-21 | 2007-09-27 | Dolby Laboratories Licensing Corporation | Low bit rate audio encoding and decoding |
JP4521633B2 (ja) * | 2004-03-12 | 2010-08-11 | 直樹 末広 | 符号分割多重信号の相関分離識別方式 |
JP5032977B2 (ja) | 2004-04-05 | 2012-09-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャンネル・エンコーダ |
BRPI0509100B1 (pt) * | 2004-04-05 | 2018-11-06 | Koninl Philips Electronics Nv | Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal |
EP1768107B1 (en) * | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7283634B2 (en) * | 2004-08-31 | 2007-10-16 | Dts, Inc. | Method of mixing audio channels using correlated outputs |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
KR101251426B1 (ko) | 2005-06-03 | 2013-04-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법 |
RU2393550C2 (ru) * | 2005-06-30 | 2010-06-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Устройство и способ кодирования и декодирования звукового сигнала |
JP5053849B2 (ja) | 2005-09-01 | 2012-10-24 | パナソニック株式会社 | マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
DE602006021347D1 (de) * | 2006-03-28 | 2011-05-26 | Fraunhofer Ges Forschung | Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion |
KR20080052813A (ko) * | 2006-12-08 | 2008-06-12 | 한국전자통신연구원 | 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법 |
DE102007018032B4 (de) | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
CN101884065B (zh) * | 2007-10-03 | 2013-07-10 | 创新科技有限公司 | 用于双耳再现和格式转换的空间音频分析和合成的方法 |
KR20100095586A (ko) | 2008-01-01 | 2010-08-31 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
EP2248352B1 (en) * | 2008-02-14 | 2013-01-23 | Dolby Laboratories Licensing Corporation | Stereophonic widening |
WO2009116280A1 (ja) | 2008-03-19 | 2009-09-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
BR112013004362B1 (pt) * | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
-
2011
- 2011-07-06 BR BR112013004362-8A patent/BR112013004362B1/pt active IP Right Grant
- 2011-07-06 EP EP20110731316 patent/EP2609590B1/en active Active
- 2011-07-06 ES ES11743459.7T patent/ES2585402T3/es active Active
- 2011-07-06 MX MX2013002188A patent/MX2013002188A/es active IP Right Grant
- 2011-07-06 RU RU2013112853/08A patent/RU2573774C2/ru active
- 2011-07-06 EP EP11743459.7A patent/EP2609591B1/en active Active
- 2011-07-06 RU RU2013112903/08A patent/RU2580084C2/ru active
- 2011-07-06 EP EP18199217.3A patent/EP3471091A1/en active Pending
- 2011-07-06 MY MYPI2015002039A patent/MY178197A/en unknown
- 2011-07-06 TR TR2019/00417T patent/TR201900417T4/tr unknown
- 2011-07-06 PL PL16196394T patent/PL3144932T3/pl unknown
- 2011-07-06 WO PCT/EP2011/061360 patent/WO2012025282A1/en active Application Filing
- 2011-07-06 AU AU2011295367A patent/AU2011295367B2/en active Active
- 2011-07-06 MY MYPI2013000574A patent/MY156770A/en unknown
- 2011-07-06 CA CA2887939A patent/CA2887939C/en active Active
- 2011-07-06 SG SG2013013693A patent/SG187950A1/en unknown
- 2011-07-06 ES ES11731316.3T patent/ES2544077T3/es active Active
- 2011-07-06 KR KR1020137007137A patent/KR101445293B1/ko active IP Right Grant
- 2011-07-06 CN CN201180051640.XA patent/CN103460282B/zh active Active
- 2011-07-06 EP EP16196394.7A patent/EP3144932B1/en active Active
- 2011-07-06 CN CN201180051699.9A patent/CN103180898B/zh active Active
- 2011-07-06 MX MX2013002187A patent/MX2013002187A/es active IP Right Grant
- 2011-07-06 JP JP2013525198A patent/JP5775582B2/ja active Active
- 2011-07-06 AU AU2011295368A patent/AU2011295368B2/en active Active
- 2011-07-06 WO PCT/EP2011/061361 patent/WO2012025283A1/en active Application Filing
- 2011-07-06 PL PL11743459.7T patent/PL2609591T3/pl unknown
- 2011-07-06 PT PT117434597T patent/PT2609591T/pt unknown
- 2011-07-06 CA CA2809404A patent/CA2809404C/en active Active
- 2011-07-06 SG SG2013012836A patent/SG188254A1/en unknown
- 2011-07-06 RU RU2015102326A patent/RU2640650C2/ru active
- 2011-07-06 KR KR1020137007136A patent/KR101445291B1/ko active IP Right Grant
- 2011-07-06 MY MYPI2013000614A patent/MY180970A/en unknown
- 2011-07-06 ES ES16196394T patent/ES2706490T3/es active Active
- 2011-07-06 BR BR112013004365-2A patent/BR112013004365B1/pt active IP Right Grant
- 2011-07-06 PT PT16196394T patent/PT3144932T/pt unknown
- 2011-07-06 PL PL11731316T patent/PL2609590T3/pl unknown
- 2011-07-06 JP JP2013525199A patent/JP5775583B2/ja active Active
- 2011-07-06 CA CA2809437A patent/CA2809437C/en active Active
- 2011-07-06 SG SG2014006738A patent/SG2014006738A/en unknown
- 2011-07-06 EP EP15167197.1A patent/EP2924687B1/en not_active Withdrawn - After Issue
- 2011-08-17 TW TW100129375A patent/TWI459380B/zh active
- 2011-08-17 TW TW100129372A patent/TWI457912B/zh active
- 2011-08-24 AR ARP110103080A patent/AR082543A1/es active IP Right Grant
- 2011-08-24 AR ARP110103079A patent/AR082542A1/es active IP Right Grant
-
2013
- 2013-02-22 US US13/774,913 patent/US9431019B2/en active Active
- 2013-02-22 US US13/775,011 patent/US8831931B2/en active Active
- 2013-03-19 ZA ZA2013/02050A patent/ZA201302050B/en unknown
- 2013-12-24 HK HK13114241.3A patent/HK1186833A1/xx unknown
- 2013-12-31 HK HK13114468.9A patent/HK1187144A1/zh unknown
-
2014
- 2014-04-09 US US14/248,747 patent/US9368122B2/en active Active
- 2014-10-17 AR ARP140103883A patent/AR098078A2/es active IP Right Grant
-
2015
- 2015-02-05 JP JP2015020813A patent/JP6196249B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070140499A1 (en) | 2004-03-01 | 2007-06-21 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101445291B1 (ko) | 결합 유닛 및 믹서를 사용하여 트랜지언트들을 포함하는 신호를 디코딩하기 위한 장치 | |
JP2011522472A (ja) | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ | |
AU2015201672B2 (en) | Apparatus for generating a decorrelated signal using transmitted phase information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170828 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180911 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20190916 Year of fee payment: 6 |