KR20110020846A - 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 - Google Patents
파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 Download PDFInfo
- Publication number
- KR20110020846A KR20110020846A KR1020107028681A KR20107028681A KR20110020846A KR 20110020846 A KR20110020846 A KR 20110020846A KR 1020107028681 A KR1020107028681 A KR 1020107028681A KR 20107028681 A KR20107028681 A KR 20107028681A KR 20110020846 A KR20110020846 A KR 20110020846A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- parametric stereo
- difference
- mono
- downmix
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성하기 위한 파라메트릭 스테레오 업믹스 장치(300, 400)에 있어서, 파라메트릭 스테레오 업믹스는 예측 계수(321)로 스케일링되는 모노 다운믹스 신호(204)에 기초하여 레프트 신호(206) 및 라이트 신호(207) 사이의 차를 포함하는 차 신호(311)를 예측하기 위한 수단(310)을 포함하는 것을 특징으로 한다. 상기 예측 계수는 공간 파라미터들(205)로부터 도출된다. 상기 파라메트릭 스테레오 업믹스 장치(300, 400)는 모노 다운믹스 신호(204) 및 상기 차 신호(311)의 합 및 차에 기초하여 레프트 신호(206) 및 라이트 신호(207)를 도출하기 위한 연산 수단(330)을 추가로 포함한다.
Description
본 발명은 공간 파라미터에 기초하여 모노 다운믹스 신호(mono downmix signal)로부터 레프트 신호 및 라이트 신호를 생성하기 위한 파라메트릭 스테레오 업믹스 장치(parametric stereo upmix apparatus)에 관한 것이다. 본 발명은 파라메트릭 스테레오 업믹스(stereo upmix) 장치를 포함하는 파라메트릭 스테레오 디코더, 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하기 위한 방법, 오디오 재생 디바이스, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더, 차 신호를 위하여 예측 잔류 신호를 생성하기 위한 방법, 및 컴퓨터 프로그램 제품에 관한 것이다.
파라메트릭 스테레오(Parametric Stereo; PS)는 지난 몇 년의 오디오 코딩에서 주요 진보들 중 하나이다. 파라메트릭 스테레오의 근본 원리들은 EURASIP J.Appl.Signal Process.에서 J. BreeBaart, S. van de Par, A. Kohlrausch 및 E. Schuijers의 "Parametric Coding of Stereo Audio" vol 9, pp. 1305-1322(2004)에 설명되어 있다. 종래의 소위 오디오 신호들의 이산 코딩과 비교하여, 도 1에 도시되어 있는 PS 인코더는 스테레오 신호 쌍(l, r)(101, 102)을 공간 이미지를 기술하는 소량의 파라미터들(103)이 추가된 단일 모노 다운믹스 신호(104)로 변환한다. 이 파라미터들은 인터채널 강도 차들(Interchannel Intensity Differences: iids), 인터채널 위상(또는 시간) 차들(Interchannel Phase(또는 Time) Differences: ipds/itds) 및 인터채널 간섭성/상관(Interchannel Coherence/Correlation: iccs)을 포함한다. PS 인코더(100)에서 스테레오 입력 신호(l, r)의 공간 이미지가 분석되어 iid, ipd 및 icc 파라미터들이 발생된다. 바람직하게도, 파라미터들은 시간 및 주파수 종속이다. 각각의 시간/주파수 타일(tile)에서, iid, ipd 및 icc 파라미터들이 결정된다. 이 파라미터들은 양자화되고 인코딩되어(140) PS 비트 스트림(bit stream)을 생성한다. 더욱이, 파라미터들은 전형적으로 또한 스테레오 입력 신호의 다운믹스가 생성되는 방법을 제어하는데 이용된다. 그 결과에 따른 모노 합 신호(들)(104)는 후속해서 레거시 모노 오디오 인코더(legacy mono audio encoder)(120)를 이용하여 인코딩된다. 최종적으로 결과적인 모노 및 PS 비트 스트림이 합병하여 전체의 스테레오 비트-스트림(107)을 구성한다.
PS 디코더(200)에서 스테레오 비트-스트림은 모노 비트-스트림(202) 및 PS 비트-스트림(203)으로 분리된다. 모노 오디오 신호는 디코딩되어서 결과적으로 모노 다운믹스 신호(204)를 재구성한다. 모노 다운믹스 신호는 디코딩된 공간 이미지 파라미터들(205)과 함께 PS 업믹스(230)에 공급된다. 그리고나서 PS 업믹스는 출력 스테레오 신호 쌍(l, r)(206, 207)을 생성한다. icc 큐(cue)들을 합성하기 위해서, PS 업믹스는 소위 비상관 신호(sd) 즉, 거의 동일한 공간 및 시간 포락선(envelope)을 갖는 모노 오디오 신호로부터 생성되지만, 모노 입력 신호에 대해 실질적으로 영(0)의 상관을 갖는 신호를 이용한다. 그리고나서, 공간 이미지 파라미터들에 기초하여, 각각의 시간/주파수 타일에 대한 PS 업믹스 내에서 2×2 행렬이 결정되고 적용된다:
여기서, Hij는 (i,j) 업믹스 행렬 H 엔트리를 나타낸다. H 행렬 엔트리들은 PS 파라미터들, iid, icc, 및 선택적으로 ipd/opd의 함수들이다. 최신 PS 시스템에서 ipd/opd 파라미터들이 이용되는 경우, 업믹스 행렬 H는:
여기서 좌측 2×2 행렬은 ipd 및 opd 파라미터들의 함수인 위상 회전을 나타내고, 우측 2×2 행렬은 iid 및 icc 파라미터들을 복구시키는 부분을 나타낸다.
WO2003090206 A1에서 디코더 내의 레프트 및 라이트 채널들을 통해 ipd를 동일하게 분배하는 것이 제안된다. 더욱이, 레프트 및 라이트 신호들 모두를 서로에 대해 측정된 ipd의 반 만큼 회전시켜서 얼라인먼트(alignment)를 획득함으로써 다운믹스 신호를 생성하는 것이 제안된다. 실제로, 위상 신호들을 거의 벗어나는 경우, 이것은, 인코더 내에서 생성되는 다운믹스 뿐만 아니라 디코더에서 생성되는 업믹스 이 둘에 대해서 ipd가 시간에 따라 180도 부근에서 약간 변하는 결과를 발생시키므로, 래핑(wrapping)에 의해 179, 178, -179, 177, -179와 같은 각들의 시퀀스가 구성될 수 있다. 이 점프들의 결과로 다운믹스에서의 후속 시간/주파수 타일들은 위상 불연속성들, 또는 다른 말로 위상 불안정성을 나타낸다. 고유의 중첩 가산(overlap-add) 합성 구조로 인해, 이는 가청 아티펙트(artefact)들을 발생시킨다.
예를 들면, 하나의 시간/주파수 타일에서 다운믹스가:
ε가 어떤 임의의 작은 각일 때
로서 생성되면, 측정된 ipd가 180도에 근접했음을 의미하고, 반면에, 다음 시간-주파수 타일에 대해서 다운믹스가:
로서 생성되면 측정된 ipd가 -180도에 근접했음을 의미하는 다운믹스를 고려하자. 전형적인 중첩 가산 합성을 이용하면 위상 소거(phase cancellation)가 후속 시간/주파수 타일들의 중간점들 사이 내에서 발생하여 아티팩트들을 야기할 것이다.
상술한 바와 같은 파라메트릭 스테레오 코딩의 주요 단점은 출력 스테레오 쌍을 생성하는데 이용되는 PS 디코더에서 청취간 위상 차(Interaural Phase Difference; ipd) 큐들의 합성이 불안정하다는 것이다. 이 불안정성은, 다운믹스를 생성하기 위한 PS 인코더에서, 그리고 출력 신호를 생성하기 위한 PS 디코더에서 실행되는 위상 수정들에서 자체의 근원(source)을 갖는다. 이 불안정성의 결과로 출력 스테레오 쌍의 더운 저급의 오디오 품질이 체험된다.
실제로 이 위상 불안정성 문제를 처리하기 위해 ipd 합성은 종종 폐기된다. 그러나, 이는 재구성된 스테레오 신호의 (공간) 오디오 품질을 저하하는 결과를 가져온다.
이 불안정성 문제를 처리하는 다른 대안은 ipd 파라미터들이 이용될 때, 위상 기준을 갖는 디코더를 제공하기 위해 비트스트림에 소위 전체 위상 차들(Overall Phase Differences; opds)을 통합시키는 것이다. 이 방법에서 시간/주파수 타일들에 대한 연속성은 공통 위상 회전을 고려함으로써 증가할 수 있다. 그러나 이는 비트레이트(bitrate)를 증가시키지 않고 발생하는 것이므로, 전체 시스템 성능이 악화되는 결과를 초래한다.
본 발명의 목적은 추가 비트 레이트가 증가하지 않고도 생성되는 레프트 및 라이트 신호들의 개선된 오디오 품질을 가지며 청취간 위상 차들(ipd들) 합성에 의해 초래되는 불안정성을 겪지 않는 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하기 위한 강화된 파라메트릭 스테레오 업믹스 장치를 제공하는 것이다.
이 목적은 예측 계수로 스케일링(scaling)되는 모노 다운믹스 신호에 기초하여 레프트 신호 및 라이트 신호의 차를 포함하는 차 신호를 예측하기 위한 수단을 포함하는 파라메트릭 스테레오(PS) 업믹스 장치에 의해서 달성된다. 예측 계수는 공간 파라미터들로부터 도출된다. 상기 PS 업믹스 장치는 모노 다운믹스 신호 및 상기 차 신호의 합 및 차에 기초하여 레프트 신호 및 라이트 신호를 도출하기 위한 연산 수단을 추가로 포함한다.
제안된 PS 업믹스 장치는 상이한 방법의 레프트 신호 및 라이트 신호의 유도를 이 공지되어 있는 PS 디코더에 제공한다. 공간 파라미터들을 적용하여 공지된 PS 디코더에서 행해지는 바와 같은 통계적 의미로 정확한 공간 이미지를 복구하는 대신, 제안된 PS 업믹스 장치는 모노 다운믹스 신호 및 공간 파라미터들과의 차 신호를 구성한다. 공지된 PS 및 제안된 PS 둘 다는 정확한 전력비(iid)들, 상호 상관(icc)들, 및 위상 관계(ipd)들을 복구하는 것이 목적이다. 그러나, 공지되어 있는 PS 디코더는 가장 정확한 파형 매칭(matching)을 달성하려는 시도를 하지 않는다. 대신에 종래의 PS 디코더는 측정된 인코더 파라미터들이 복구된 디코더 파라미터들과 통계적으로 매칭하는 것을 보장한다. 제안된 PS 업믹스에서는 모노 다운믹스 신호 및 추정된 차 신호에 적용되는 합 및 차와 같은, 단순한 대수 연산들에 의해, 레프트 신호 및 라이트 신호가 획득된다. 그와 같은 구성은 재구성된 레프트 및 라이트 신호들의 품질 및 안정성에 비해 훨씬 양호한 결과들을 제공하는데, 왜냐하면 그것은 신호의 원래 위상 작용을 복구하는 근접한 파형 매칭을 제공하기 때문이다.
실시예에서, 상기 예측 계수는 다운믹스 신호를 차 신호 상으로 파형 매칭시키는 것에 기초하여 한다. 그와 같은 파형 매칭은 통계적 방법이 ipd 및 opd 합성에 대한 공지되어 있는 PS 디코더에서 이용될 때의 불안정성을 겪지 않는데 왜냐하면 파형 매칭은 내재적으로 위상 보존(phase preservation)을 제공하기 때문이다. 그러므로 (복소값인) 스케일링된 모노 다운믹스 신호로 도출되는 차 신호를 이용하고 파형 매칭에 기초하여 예측 계수를 도출함으로써 공지되어 있는 PS 디코더의 불안정성의 근원이 제거된다. 상기 파형 매칭은 예를 들면, 모노 다운믹스 신호의 차 신호로의 최소 자승 매칭을 포함하고, 차 신호를:
부가적인 실시예에서, 예측 계수는 공간 파라미터들의 함수로 제공된다:
여기서, iid, ipd, 및 icc는 공간 파라미터들이고, iid는 인터채널 강도 차이고, ipd는 인터채널 위상차이고, icc는 인터채널 간섭성이다. 일반적으로 의미론적으로 가치있는 관점에서 복소값의 예측 계수 를 양자화하는 것은 어려운데, 왜냐하면 요구되는 정확성은 재구성될 좌 및 우 오디오 신호들의 특성들에 좌우되기 때문이다. 그러므로, 본 실시예의 장점은 복소 예측 계수 와는 대조적으로, 공간 파라미터들에 요구되는 양자화 정확성들은 심리 음향(psycho-acoustics)들로부터 널리 공지되어 있다는 점이다. 이와 같으므로, 심리 음향 정보의 최적의 이용이 효과적으로, 즉 가능한 가장 적은 단계들로, 예측 계수를 양자화하여 비트 레이트를 줄이는데 이용될 수 있다. 더욱이, 본 실시예는 역호환 PS 콘텐츠를 이용하는 업믹싱(upmixing)을 가능하게 한다.
부가적인 실시예에서, 차 신호를 예측하기 위한 수단은 스케일링된 비상관 모노 다운믹스 신호를 추가함으로써 차 신호를 강화하도록 배열된다. 일반적으로 모노 다운믹스 신호로부터 원래의 인코더 차 신호를 완전하게 예측하는 것은 가능하지 않기 때문에, 잔류 신호가 발생한다. 이 잔류 신호는 다운믹스 신호와 상관하지 않는데, 만일 상관된다면 그것은 예측 계수에 의해 고려되었을 것이다. 많은 경우들에서 잔류 신호는 녹음의 방향 사운드 필드(sound field)를 포함한다. 잔류 신호는 모노 다운믹스 신호로부터 도출되는 비상관 모노 다운믹스 신호를 이용하여 효과적으로 합성될 수 있다.
부가적인 실시예에서, 상기 비상관 모노 다운믹스는 모노 다운믹스 신호를 필터링하는 것에 의해 달성된다. 이 필터링의 목표는 모노 다운믹스 신호와 유사한 공간 및 시간 포락선을 가지면서도 상관이 실질적으로 영(0)에 근접한 신호를 효과적으로 생성해서 상기 신호가 인코더에서 도출되는 잔류 성분의 합성 변형에 대응하도록 하는 것이다. 이는 예를 들면, 전 통과(allpass) 필터링, 지연들, 격자 반향 필터들, 피드백 지연 네트워크들 또는 이들의 결합에 의해 달성될 수 있다. 추가적으로, 전력 정규화는, 비상관 신호의 각각의 시간/주파수 타일에 대한 전력이 모노 다운믹스 신호의 시간/주파수 타일에 밀접하게 대응하는 것을 보장하기 위해, 비상관 신호에 적용될 수 있다. 이 방법에서 디코더 출력 신호가 디코딩된 신호 전력의 정확한 양을 포함할 것임이 보장된다.
부가적인 실시예에서, 비상관 모노 다운믹스에 적용되는 스케일링 팩터(scaling factor)는 예측 에너지 손실을 보상하도록 세팅된다. 비상관 모노 다운믹스에 적용되는 스케일링 팩터는 디코더 측에서의 레프트 신호 및 라이트 신호가 인코더 측에서의 레프트 및 라이트 신호 전력의 신호 전력과 각각 매칭된다. 이와 같으므로 스케일링 팩터 는 또한 예측 에너지 손실 보상 팩터로 해석될 수 있다.
부가적인 실시예에서, 비상관 모노 다운믹스에 적용되는 스케일링 팩터는 공간 파라미터들의 함수로서 제공된다:
여기서, iid, ipd, 및 icc는 공간 파라미터들이고, iid는 인터채널 강도 차이고, ipd는 인터채널 위상 차이고, icc는 인터채널 간섭성이고, 는 예측 계수이다. 유사하게도 예측 계수의 경우에서처럼, 비상관 스케일링 팩터 를 공간 파라미터들의 함수로 표시하는 것은 이 공간 파라미터들의 필요한 양자화 정확성들에 대한 정보의 이용을 인에이블(enable)한다. 이와 같으므로, 심리 음향 정보의 최적의 이용은 비트 레이트를 낮추는데 이용될 수 있다.
부가적인 실시예에서, 상기 파라메트릭 스테레오 업믹스는 추가 입력으로서 차 신호에 대한 예측 잔류 신호를 가짐으로써, 연산 수단은 차 신호에 대한 상기 예측 잔류 신호에 기초하여 또한 레프트 신호 및 라이트 신호를 도출하도록 배열된다. 긴 이름들의 신호들을 피하기 위해 예측 잔류 신호는 특허 출원의 나머지 부분 전체에 걸쳐 차 신호에 대한 예측 잔류 신호에 이용된다. 예측 잔류 신호는 자체의 원래의 인코더의 대응하는 신호에 의해서 합성 비상관 신호에 대한 대체로서 동작한다. 이는 디코더에서의 원래의 스테레오 신호를 복구하는 것을 가능하게 한다. 그러나 이는 추가 비트레이트를 희생하는데 왜냐하면 예측 신호가 인코딩되고 디코더에 송신될 필요가 있기 때문이다. 그러므로, 전형적으로 예측 잔류 신호의 대역폭이 제한된다. 예측 잔류 신호는 소정의 시간/주파수 타일에 대한 비상관 모노 다운믹스 신호를 완전히 대체할 수 있거나 또는 보완 방식으로 동작할 수 있다. 후자는 예측 잔류 신호가 단지 적게 코딩되는, 예를 들면, 가장 중요한 주파수 빈(bin)들 중 서너 개만이 인코딩되는 경우에 유리할 수 있다. 이 경우에, 인코더 상황과 비교해서, 정지 에너지가 상실될 것이다. 이 에너지의 부족은 비상관 신호에 의해 채워질 것이다. 이때 새로운 비상관 스케일링 팩터 는:
본 발명은 부가적으로 파라메트릭 스테레오 업믹스를 포함하는 파라메트릭 스테레오 디코더 및 상기 파라메트릭 스테레오 디코더를 포함하는 오디오 재생 디바이스를 제공한다.
본 발명은 또한 파라메트릭 스테레오 다운믹스 장치 및 상기 파라미터 스테레오 다운믹스 장치를 포함하는 파라메트릭 스테레오 인코더를 제공한다.
본 발명은 부가적으로 프로그램 디바이스가 본 발명에 따른 방법을 제공할 수 있는 방법 청구항들 뿐만 아니라, 컴퓨터 프로그램 제품을 제공한다.
본 발명의 상기 및 다른 양태들은 도면들에 도시되는 실시예들을 참조하여 명확해지고 명백해질 것이다.
도 1은 파라메트릭 스테레오 인코더의 아키텍처를 개략적으로 도시한 개략도(종래 기술).
도 2는 파라메트릭 스테레오 디코더의 아키텍처를 개략적으로 도시한 개략도(종래 기술).
도 3은 본 발명에 따르며, 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 4는 스케일링된 비상관 모노 다운믹스 신호를 가산함으로써 차 신호를 증가하도록 배열되는 예측 수단을 포함하는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 5는 차 신호에 대한 예측 잔류 신호를 추가 입력으로 갖는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 6은 본 발명에 따른 파라메트릭 스테레오 업믹시 장치를 포함하는 파라메트릭 스테레오 디코더를 도시한 도면.
도 7은 본 발명에 따른 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하는 방법에 대한 흐름도.
도 8은 본 발명에 따르고, 공간 파라미터들에 기초하여 레프트 신호 및 라이트 신호로부터 모노 다운믹스 신호를 생성하는 파라메트릭 스테레오 다운믹스 장치를 도시한 도면.
도 9는 본 발명에 따른 파라메트릭 스테레오 다운믹스 장치를 포함하는 파라메트릭 스테레오 인코더를 도시한 도면.
도 2는 파라메트릭 스테레오 디코더의 아키텍처를 개략적으로 도시한 개략도(종래 기술).
도 3은 본 발명에 따르며, 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 4는 스케일링된 비상관 모노 다운믹스 신호를 가산함으로써 차 신호를 증가하도록 배열되는 예측 수단을 포함하는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 5는 차 신호에 대한 예측 잔류 신호를 추가 입력으로 갖는 파라메트릭 스테레오 업믹스 장치를 도시한 도면.
도 6은 본 발명에 따른 파라메트릭 스테레오 업믹시 장치를 포함하는 파라메트릭 스테레오 디코더를 도시한 도면.
도 7은 본 발명에 따른 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 신호 및 라이트 신호를 생성하는 방법에 대한 흐름도.
도 8은 본 발명에 따르고, 공간 파라미터들에 기초하여 레프트 신호 및 라이트 신호로부터 모노 다운믹스 신호를 생성하는 파라메트릭 스테레오 다운믹스 장치를 도시한 도면.
도 9는 본 발명에 따른 파라메트릭 스테레오 다운믹스 장치를 포함하는 파라메트릭 스테레오 인코더를 도시한 도면.
도면들 전체를 통해, 동일한 참조 번호들은 유사하거나 대응하는 특성들을 나타낸다. 도면들에 나타나는 일부의 특성들은 전형적으로 소프트웨어에서 구현되고, 그와 같으므로 소프트웨어 모듈들 또는 객체들과 같은 소프트웨어 엔티티(software entity)들을 나타낸다.
도 3은 본 발명에 따른 파라메트릭 스테레오 업믹스 장치(300)를 도시한다. 상기 파라메트릭 스테레오 업믹스 장치(300)는 공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성한다.
상기 파라메트릭 업믹스 장치(300)는 예측 계수(321)로 스케일링되는 모노 다운믹스 신호(204)를 기초한 레프트 신호(206) 및 라이트 신호(207) 사이의 차를 포함하는 차 신호(311)를 예측하기 위한 수단(310)을 포함함으로써, 상기 예측 계수(321)는 모노 다운믹스 신호(204) 및 상기 차 신호(311)의 합 및 차에 기초하여 레프트 신호(206) 및 라이트 신호(207)를 도출하도록 유닛(320) 및 연산 수단(330) 내에서 공간 파라미터들(205)로부터 도출된다.
레프트 신호(206) 및 라이트 신호(207)는 바람직하게 다음과 같이 재구성된다:
여기서, s는 모노 다운믹스 신호이고, d는 차 신호이다. 이는 인코더 합 신호가:
실제로 이득 정규화는 종종 레프트 신호(206) 및 라이트 신호(207)를 구성할 때 적용된다:
여기서, c는 이득 정규화 상수이고 공간 파라미터들의 함수이다. 이득 정규화는 모노 다운믹스 신호(204)의 전력이 레프트 신호(206) 및 라이트 신호(207)의 전력들의 합과 같음을 보장한다. 이 경우에 인코더 합 신호는:
로 계산되었다.
공간 파라미터들은 인코더에서 미리 계산되고 파라메트릭 스테레오 업믹스(300)를 포함하는 디코더로 송신된다. 상기 공간 파라미터들은 각각의 시간/주파수 타일에 대한 프레임-바이-프레임(frame-by-frame)에 기초하여:
여기서, iid는 인터채널 강도 차이고, icc는 인터채널 간섭성이고, ipd는 인터채널 위상 차이고, 및 은 각각 레프트 및 라이트 신호 전력들이고 은 레프트 및 라이트 신호들 사이에서의 비 표준화 복소값 공분산 계수를 나타낸다.
DFT(FFT)와 같은 전형적인 복소값 주파수 도메인의 경우, 이 전력들은:
여기서, ktile은 파라미터 대역에 해당하는 DFT 빈들을 나타낸다. 또한 예를 들면, 2002년 11월 Leuven, Belgium, Proc.1st IEEE Benelux Workshop on Model based Processing and Coding of Audio(MPCA-2002)에서의 P. Ekstrand의 "Bandwidth extension of audio signals by spectral band replication" pp. 73-79에 기술되는 바와 같은 복소 지수식으로 변조되는 QMF 뱅크(bank)와 같은, 다른 복수 도메인 표현, 이 이용될 수 있음이 주목되어야 한다.
1.5 내지 2 kHz까지의 저 주파수들의 경우 상기 식이 유효하다. 그러나, 보다 높은 주파수들에서 ipd 파라미터들은 인식과 연관되지 않으므로 영(0) 값으로 세팅되어:
의 결과를 발생시킨다.
대안으로, 더 높은 주파수들에서, 위상 차들보다는 오히려 광대역 포락선이 인식에 더 중요하므로, icc는:
이득 정규화 상수 c는:
c가 위상을 벗어난 레프트 및 라이트 신호들로 인해 무한대가 될 수 있으므로, 이득 정규화 상수 c의 값은 전형적으로:
로 제한되고, 여기서 cmax는 최대 증폭 계수, 예를 들면, cmax = 2이다.
실시예에서, 상기 예측 계수는 파형 매칭을 이용하여 모노 다운믹스 신호(204)와의 차 신호(311)를 추정하는 것에 기초한다. 상기 파형 매칭은 예를 들면, 모노 다운믹스 신호(204)의 차 신호(311) 상으로의 최소 자승 매칭을 포함함으로써 결과적으로 차 신호는:
최소 자승 매칭 외에도, L2-놈(norm)과 상이한 놈을 이용하는 파형 매칭이 이용될 수 있다. 대안으로, p-놈 에러 는 예를 들면, 지각에 따르면 가중될 수 있다. 그러나, 최소 자승 매칭은 결과적으로 송신되는 공간 이미지 파라미터들로부터 예측 계수들을 도출하는데 상대적으로 단순한 계산들을 발생시키므로 유용하다.
에 의해 제공되는 것은 널리 공지되어 있고, 여기서 는 모노 다운믹스 신호(204) 및 차 신호(311)의 상호 상관의 켤레 복소수를 나타내고 는 모노 다운믹스 신호의 전력을 나타낸다.
부가적인 실시예에서, 예측 계수(321)는 공간 파라미터들의 함수로서 제공된다:
상기 예측 계수는 상기 식에 따라 유닛(320)에서 계산된다.
도 4는 스케일링된 비상관 모노 다운믹스 신호를 가산함으로써 차 신호를 강화하도록 배열되는 예측 수단(310)을 포함하는 파라메트릭 스테레오 업믹스 장치(300)를 도시한다. 모노 다운믹스 신호(204)는 비상관화를 위해 유닛(340)에 제공된다. 결과적으로 비상관된 모노 다운믹스 신호(341)는 유닛(340)의 출력에 제공된다. 예측 수단(310)에서 차 신호의 제 1 부분은 모노 다운믹스 신호(204)를 예측 계수(321)로 스케일링함으로써 계산된다. 추가적으로 비상관된 모노 다운믹스 신호(341)는 또한 예측 수단(310)에서 스케일 팩터(322)로 스케일링된다. 결과적인 차 신호의 제 2 부분은 결과적으로 차 신호의 제 1 부분에 가산되어 결과적으로 차 신호(311)가 강화된다. 모노 다운믹스 신호(204) 및 강화된 차 신호(311)는 연산 수단(330)에 제공되고, 연산 수단(330)은 레프트 신호(206) 및 라이트 신호(207)를 계산한다.
일반적으로 단지 예측 계수와 스케일링함으로써 모노 다운믹스 신호와의 차 신호를 정확하게 예측하는 것은 가능하지 않다. 이는 잔류 신호 를 발생시킨다. 이 잔류 신호는 다운믹스 신호와 상관하지 않는데, 만일 상관된다면 그것은 예측 계수에 의해 고려되었을 것이다. 많은 경우들에서 잔류 신호는 녹음의 방향 사운드 필드를 포함한다. 잔류 신호는 모노 다운믹스 신호로부터 도출되는 비상관 모노 다운믹스 신호를 이용하여 효과적으로 합성될 수 있다. 상기 비상관된 신호는 예측 수단(310)에서 계산되는 차 신호의 제 2 부분이다.
부가적인 실시예에서, 상기 비상관된 모노 다운믹스(341)는 모노 다운믹스 신호(204)를 필터링하는 수단에 의해 획득된다. 상기 필터링은 유닛(340)에서 실행된다. 필터링은 모노 다운믹스 신호(204)와 유사한 공간 및 시간 포락선을 가지면서도 상관이 실질적으로 영(0)에 근접한 신호를 생성해서 상기 신호가 인코더에서 도출되는 잔류 성분의 합성 변형에 대응하도록 하는 것이다. 이 효과는 예를 들면, 전 통과 필터링, 지연들, 격자 반향 필터들, 피드백 지연 네트워크들 또는 이들의 결합에 의해 달성될 수 있다.
부가적인 실시예에서, 비상관 모노 다운믹스(341)에 적용되는 스케일링 팩터(322)는 예측 에너지 손실을 보상하도록 세팅된다. 비상관 모노 다운믹스(341)에 적용되는 스케일링 팩터(322)는 파라메트릭 스테레오 업믹스 장치(300)의 출력에서의 레프트 신호(206) 및 라이트 신호(207)의 전체 신호 전력이 인코더 측에서의 레프트 및 라이트 신호 전력의 신호 전력과 각각 매칭하는 것을 보장한다. 이와 같으므로 로 더 나타내는 스케일링 팩터(322)는 예측 에너지 손실 보상 팩터로 해석된다. 이때 차 신호 d는:
여기서, sd는 비상관 모노 다운믹스 신호이다.
상기 스케일링 팩터(322)는:
로서 차 신호 d 및 모노 다운믹스 신호 s에 대응하는 신호 전력들의 항으로 표시될 수 있다.
부가적인 실시예에서, 비상관 모노 다운믹스(341)에 적용되는 스케일링 팩터(322)는 공간 파라미터들(205)의 함수로 제공된다:
상기 스케일링 팩터(322)는 유닛(320)에서 도출된다.
다운믹스 정규화가 적용되었던, 즉, 다운믹스 신호가 s = c(l + r)로 계산되었던 경우, 레프트 신호(206) 및 라이트 신호(207)는:
도 5는 차 신호(331)에 대한 예측 잔류 신호를 추가 입력으로 갖는 파라메트릭 스테레오 업믹스 장치(500)를 도시한다. 연산 수단(330)은 모노 다운믹스 신호(204), 차 신호(311), 및 상기 예측 잔류 신호(331)에 기초하여 레프트 신호(206) 및 라이트 신호(207)를 도출하도록 배열된다. 수단(310)은 예측 계수(321)로 스케일링되는 모노 다운믹스 신호(204)에 기초하여 차 신호(311)를 예측한다. 상기 예측 계수(321)는 공간 파라미터들(205)에 기초하여 유닛(320)에서 도출된다.
레프트 신호(206) 및 라이트 신호(207)는 각각:
여기서, dres는 예측 잔류 신호이다.
대안으로, 전력 정규화가 다운믹스에 적용되었으나 잔류 신호에 적용되지 않았던 경우 레프트 신호 및 라이트 신호는:
예측 잔류 신호(331)는 자체의 원래의 인코더의 대응하는 신호에 의해서 합성 비상관 신호(341)에 대한 대체로서 동작한다. 이는 파라메트릭 스테레오 업믹스 장치(300)에 의해 원래의 스테레오 신호를 복구하는 것을 가능하게 한다. 예측 잔류 신호(331)는 소정의 시간/주파수 타일에 대한 비상관 모노 다운믹스 신호(341)를 완전히 대체할 수 있거나 또는 보완 방식으로 동작할 수 있다. 후자는 예측 잔류 신호가 단지 적게 코딩되는, 예를 들면, 가장 중요한 주파수 빈들 중 서너 개만이 인코딩되는 경우에 유리할 수 있다. 이 경우에, 인코더 예측 잔류 신호와 비교해서, 정지 에너지가 상실될 것이다. 이 에너지의 부족은 비상관 신호(341)에 의해 채워질 것이다. 이때 새로운 비상관 스케일링 팩터 는:
파라메트릭 스테레오 업믹스 장치(300)는 추가 적응들 없이도 파라메트릭 스테레오 디코더의 최신 아키텍처에서 이용될 수 있다. 이때 파라메트릭 스테레오 업믹스 장치(300)는 도 2에 도시되는 바와 같이 업믹스 유닛(230)을 대체한다. 예측 잔류 신호(331)가 파라메트릭 스테레오 업믹스(400)에 의해 이용되면, 두 개의 적응들이 필요하고, 이는 도 6에 도시된다.
도 6은 본 발명에 따른 파라메트릭 스테레오 업믹스 장치(400)를 포함하는 파라매트릭 스테레오 디코더를 도시한다. 파라메트릭 스테레오 디코더는 입력 비트스트림을 모노 비트스트림(202)으로 분리하기 위한 디멀티플렉싱(demultiplexing) 수단(210), 예측 잔류 비트스트림(332), 및 파라미터 비트스트림(203)을 포함한다. 모노 디코딩 수단(220)은 상기 모노 비트스트림(202)을 모노 다운믹스 신호(204)로 디코딩한다. 모노 디코딩 수단은 예측 잔류 비트스트림(332)을 예측 잔류 신호(331)로 디코딩하도록 더 구성된다. 파라미터 디코딩 수단(240)은 파라미터 비트스트림(203)을 공간 파라미터들(205)로 디코딩한다. 파라메트릭 스테레오 업믹스 장치(400)는 공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204) 및 예측 잔류 신호(331)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성한다. 노모 다운믹스 신호(204) 및 예측 잔류 신호의 디코딩이 디코딩 수단(220)에 의해 실행될지라도, 상기 디코딩은 각각의 신호들이 디코딩되는 별개의 디코딩 소프트웨어 및/또는 하드웨어에 의해 실행되는 것이 가능하다.
도 7은 본 발명에 따른 공간 파라미터들에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성하기 위한 방법의 흐름도를 도시한다. 제 1 단계 710에서 레프트 신호(206) 및 라이트 신호(207) 사이의 차를 포함하는 차 신호(311)는 예측 계수(321)로 스케일링되는 모노 다운믹스 신호(204)에 기초하여 예측되고, 여기서 상기 예측 계수는 공간 파라미터들(205)로부터 도출된다. 제 2 단계 720에서 레프트 신호(206) 및 라이트 신호(207)는 모노 다운믹스 신호(204) 및 상기 차 신호(311)의 합 및 차에 기초하여 도출된다.
예측 잔류 신호가 제 2 단계 720에서 이용 가능하면 모노 다운믹스 신호(204) 옆의 예측 잔류 신호 및 차 신호(311)가 레프트 신호(206) 및 라이트 신호(207)를 도출하는데 이용된다.
파라메트릭 스테레오 업믹스(300)가 파라메트릭 스테레오 디코더에서 이용되면, 파라메트릭 스테레오 인코더의 수정들이 필요하지 않다. 종래 기술에 공지되어 있는 바와 같은 파라메트릭 스테레오 인코더가 이용될 수 있다.
그러나, 파라메트릭 스테레오 업믹스(400)가 이용되면 파라메트릭 스테레오 인코더는 비트스트림 내의 예측 잔류 신호를 제공하도록 적응되어야만 한다.
도 8은 본 발명에 따른 파라메트릭 스테레오 다운믹스 장치(800)를 도시하고, 상기 파라메트릭 스테레오 다운믹스 장치는 공간 파라미터들에 기초하여 레프트 신호 및 라이트 신호로부터 모노 다운믹스 신호를 생성한다. 상기 파라메트릭 스테레오 다운믹스 장치(800)는 모노 다운믹스 신호(104) 옆에서 예측 잔류 신호인 추가 신호(801)를 출력한다. 상기 파라메트릭 스테레오 다운믹스 장치(800)는 모노 다운믹스 신호(104) 및 레프트 신호(101) 및 라이트 신호(102) 사이의 차를 포함하는 차 신호(811)를 도출하기 위한 부가 연산 수단(810)을 포함한다. 상기 파라메트릭 스테레오 다운믹스 장치(800)는 예측 잔류 신호(801)(차 신호에 대한)를, 공간 파라미터들(103)로부터 도출된 미리 결정되는 예측 계수(831)로 스케일링되는 모노 다운믹스 신호(104) 및 차 신호(811) 사이의 차로서 도출하기 위하여, 부가 예측 수단(820)을 추가로 포함한다. 상기 미리 결정된 예측 계수는 유닛(830)에서 결정된다. 미리 결정된 예측 계수는 모노 다운믹스 신호(104)에 직교하는 예측 잔류 신호(801)를 제공하도록 선택된다. 게다가 다운믹스 신호의 전력 정규화가 이용될 수 있다(도 8에 도시되지 않는다).
모노 다운믹스 및 예측 잔류에 대응하는 신호들의 번호들이 파라메트릭 스테레오 업믹스 장치 및 파라메트릭 스테레오 다운믹스 장치에서 상이한 참조 번호들을 가질지라도, 모노 다운믹스 신호들(204 및 104)은 서로 대응하고 예측 잔류 신호(331 및 801) 또한 서로 대응하는 것이 명백할 것이다.
도 9는 본 발명에 따른 파라메트릭 스테레오 다운믹스 장치(800)를 포함하는 파라메트릭 스테레오 인코더를 도시한다. 상기 파라메트릭 스테레오 인코더는:
- 레프트 신호(101) 및 라이트 신호(102)로부터 공간 파라미터들(103)을 도출하기 위한 추정 수단(130),
- 공간 파라미터들(103)에 기초하여 레프트 신호(101) 및 라이트 신호(102)로부터 모노 다운믹스 신호(104)를 생성하기 위한 본 발명에 따른 파라메트릭 스테레오 다운믹스 장치(110),
- 상기 모노 다운믹스 신호(104)를 모노 비트스트림(105)으로 인코딩하고, 예측 잔류 신호(801)를 예측 잔류 비트스트림(802)으로 인코딩하도록 더 배열되는, 모노 인코딩 수단(120),
- 공간 파라미터들(103)을 파라미터 비트스트림(106)으로 인코딩하기 위한 파라미터 인코딩 수단(140), 및
- 모노 비트스트림(105), 파라미터 비트스트림(106), 및 예측 잔류 비트스트림(802)을 출력 비트스트림(107)으로 합병하기 위한 멀티플렉싱 수단(150)을 포함한다.
모노 다운믹스 신호(104) 및 예측 잔류 신호(801)의 인코딩이 인코딩 수단(120)에 의해 실행될지라도, 상기 인코딩은 신호들 각각이 인코딩되는 개별 디코딩 소프트웨어 및/또는 하드웨어에 의해 실행되는 것이 가능하다.
더욱이, 개별적으로 열거될지라도, 복수의 수단들, 요소들 또는 방법 단계들은 예를 들면, 단일 유닛 또는 프로세서에 의해 구현될 수 있다. 게다가, 개별 특성들이 다른 청구항들에 포함될 수 있을지라도, 이들은 가능하면 유용하게 결합될 수 있고, 상이한 청구항들에 포함되는 것을 특성들의 결합이 실현 가능하지 않고/않거나 유용하지 않음을 의미하는 것은 아니다. 또한 하나의 범주의 청구항들에 특성들이 포함되는 것은 상기 범주로의 제한을 의미하지 않고 오히려 적절할 때 다른 청구항 카테고리들로 마찬가지로 적용 가능하다는 것을 나타낸다. 게다가, 청구항들에서의 특성들의 순서는 특성들이 작용해야만 하는 어떤 특정 순서를 의미하지 않고 특히 방법 청구항들에서 개별 단계들의 순서는 단계들이 그 순서로 실행되어야만 한다는 것을 의미하지 않는다. 오히려, 단계들은 임의의 적절한 순서로 실행될 수 있다. 그러므로 "a", "an", "first", "second" 등의 언급들이 복수를 배제하지 않는다. 청구항들에서의 참조 부호들은 단지 예를 명료하게 하도록 제공된 것으로 청구항들의 범위를 제한하는 것으로 결코 해석되어서는 안 된다.
204: 모노 다운믹스 신호 206: 레프트 신호
207: 라이트 신호 210: 디멀티플렉싱 수단
220: 모노 디코딩 수단
240: 파라미터 디코딩 수단
300, 500: 스테레오 업믹스 장치 310: 예측 수단
311, 331: 차 신호 330: 연산 수단
341: 비상관 신호
800: 파라메트릭 스테레오 다운믹스 장치
207: 라이트 신호 210: 디멀티플렉싱 수단
220: 모노 디코딩 수단
240: 파라미터 디코딩 수단
300, 500: 스테레오 업믹스 장치 310: 예측 수단
311, 331: 차 신호 330: 연산 수단
341: 비상관 신호
800: 파라메트릭 스테레오 다운믹스 장치
Claims (18)
- 공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성하기 위한 파라메트릭 스테레오 업믹스 장치(300, 400)에 있어서,
상기 파라메트릭 스테레오 업믹스 장치(300, 400)는 상기 공간 파라미터들(205)로부터 도출되는 예측 계수(321)로 스케일링되는 모노 다운믹스 신호(204)에 기초하여 상기 레프트 신호(206) 및 상기 라이트 신호(207) 사이의 차를 포함하는 차 신호(311)를 예측하기 위한 수단(310), 및 상기 모노 다운믹스 신호(204) 및 상기 차 신호(311)의 합 및 차에 기초하여 상기 레프트 신호(206) 및 상기 라이트 신호(207)를 도출하기 위한 연산 수단(330)을 포함하는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 제 1 항에 있어서,
상기 예측 계수(321)는 상기 다운믹스 신호(204)를 상기 차 신호(311) 상으로 매칭하는 파형에 기초하는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 차 신호(311)를 예측하기 위한 상기 수단(310)은 스케일링된 비상관 모노 다운믹스 신호를 가산함으로써 상기 차 신호를 강화하도록 배열되는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 제 4 항에 있어서,
상기 비상관 모노 다운믹스(341)는 상기 모노 다운믹스 신호(204)를 필터링하여 획득되는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 제 4 항에 있어서,
상기 비상관 모노 다운믹스(341)에 적용되는 상기 스케일링 팩터(322)는 예측 에너지 손실을 보상하도록 세팅되는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
상기 파라메트릭 스테레오 업믹스(300, 400)는 추가 입력으로서 차 신호(331)에 대한 예측 잔류 신호를 가지고, 상기 연산 수단(330)은 상기 모노 다운믹스 신호(204), 상기 차 신호(311), 및 상기 차 신호(331)에 대한 상기 예측 잔류 신호에 기초하여 상기 레프트 신호(206) 및 상기 라이트 신호(207)를 도출하도록 배열되는, 파라메트릭 스테레오 업믹스 장치(300, 400). - 파라메트릭 스테레오 디코더에 있어서:
입력 비트스트림(201)을 모노 비트스트림(202) 및 파라미터 비트스트림(203)으로 분리하기 위한 디멀티플렉싱 수단(210), 상기 모노 비트스트림을 모노 다운믹스 신호(204)로 디코딩하기 위한 모노 디코딩 수단(220), 상기 파라미터 비트스트림을 공간 파라미터들(205)로 디코딩하기 위한 파라미터 디코딩 수단(240), 및 공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성하기 위한 파라메트릭 스테레오 업믹스 수단(230)을 포함하고, 제 1 항 내지 제 7 항에 따른 파라메트릭 스테레오 업믹스 장치(300)를 추가로 포함하는, 파라메트릭 스테레오 디코더. - 파라메트릭 스테레오 디코더로서, 입력 비트스트림(201)을 모노 비트스트림(202) 및 파라미터 비트스트림(203)으로 분리하기 위한 디멀티플렉싱 수단(210), 상기 모노 비트스트림을 모노 다운믹스 신호(204)로 디코딩하기 위한 모노 디코딩 수단(220), 상기 파라미터 비트스트림을 공간 파라미터들(205)로 디코딩하기 위한 파라미터 디코딩 수단(240), 및 공간 파라미터들(205)에 기초하여 모노 다운믹스 신호(204)로부터 레프트 신호(206) 및 라이트 신호(207)를 생성하기 위한 파라메트릭 스테레오 업믹스 수단(230)을 포함하는, 상기 파라메트릭 스테레오 디코더에 있어서:
상기 디멀티플렉싱 수단(210)은 상기 입력 비트스트림으로부터 예측 잔류 비트스트림(332)을 추출하도록 더 배열되고, 상기 모노 디코딩 수단(220)은 상기 예측 잔류 비트스트림으로부터 상기 차 신호(331)에 대한 예측 잔류 신호를 디코딩하도록 더 배열되고, 상기 파라메트릭 스테레오 업믹스 수단(230)은 제 8 항에 따른 파라메트릭 스테레오 업믹스 장치인, 파라메트릭 스테레오 디코더. - 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 및 라이트 신호를 생성하기 위한 방법에 있어서:
- 상기 공간 파라미터들로부터 도출되는 예측 계수로 스케일링된 모노 다운믹스 신호에 기초하여 레프트 신호 및 라이트 신호 사이의 차를 포함하는 차 신호를 예측하는 단계; 및
- 상기 모노 다운믹스 신호 및 상기 차 신호의 합 및 차에 기초하여 상기 레프트 신호 및 상기 라이트 신호를 도출하는 단계를 포함하는, 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 및 라이트 신호를 생성하기 위한 방법. - 제 11 항에 있어서,
상기 레프트 신호 및 상기 라이트 신호를 도출하는 단계는 상기 차 신호에 대한 예측 잔류 신호에 또한 기초하는, 공간 파라미터들에 기초하여 모노 다운믹스 신호로부터 레프트 및 라이트 신호를 생성하기 위한 방법. - 제 9 항 또는 제 10 항에 따른 파라메트릭 스테레오 디코더를 포함하는, 오디오 재생 디바이스.
- 공간 파라미터들(103)에 기초하여 레프트 신호(101) 및 라이트 신호(102)로부터 모노 다운믹스 신호(104)를 생성하기 위한 파라메트릭 스테레오 다운믹스 장치(800)에 있어서,
상기 파라메트릭 스테레오 다운믹스 장치(800)는 추가 출력으로서 차 신호(801)에 대한 예측 잔류 신호를 갖고, 상기 파라메트릭 스테레오 다운믹스 장치는 모노 다운믹스 신호(104) 및 상기 레프트 신호 및 상기 라이트 신호 사이의 차를 포함하는 차 신호(811)를 도출하기 위한 부가 연산 수단(810), 및 상기 차 신호(801)에 대한 예측 잔류 신호를 상기 차 신호(811) 및 상기 공간 파라미터들(103)로부터 도출되고 미리 결정된 예측 계수(831)로 스케일링되는 모노 다운믹스 신호(104) 사이의 차로서 도출하기 위한 부가 예측 수단(820)을 포함하는, 파라메트릭 스테레오 다운믹스 장치(800). - 파라메트릭 스테레오 인코더로서, 레프트 신호(101) 및 라이트 신호(102)로부터 공간 파라미터들(103)을 도출하기 위한 추정 수단(130), 공간 파라미터들에 기초하여 상기 레프트 신호 및 상기 라이트 신호로부터 모노 다운믹스 신호(104)를 생성하기 위한 파라메트릭 스테레오 다운믹스 수단(110), 상기 모노 다운믹스 신호를 모노 비트스트림(105)으로 인코딩하는 모노 인코딩 수단(120), 공간 파라미터들을 파라미터 비트스트림(106)으로 인코딩하기 위한 파라미터 인코딩 수단(140), 및 모노 비트스트림 및 파라미터 비트스트림을 출력 비트스트림으로 통합하기 위한 멀티플렉싱 수단(150)을 포함하는, 상기 파라메트릭 스테레오 인코더에 있어서,
상기 파라메트릭 스테레오 다운믹스 수단(110)은 제 14 항에 따른 파라메트릭 스테레오 다운믹스 장치이고, 상기 모노 인코딩 수단(220)은 상기 차 신호(801)에 대한 예측 잔류 신호를 예측 잔류 비트스트림(802)으로 인코딩하도록 더 배열되고, 상기 멀티플렉싱 수단(150)은 상기 예측 비트스트림을 상기 출력 스트림으로 합병하도록 더 배열되는, 파라메트릭 스테레오 인코더. - 공간 파라미터들에 기초하여 레프트 신호 및 라이트 신호로부터 차 신호에 대한 예측 잔류 신호를 생성하기 위한 방법에 있어서:
- 상기 레프트 신호 및 상기 라이트 신호 사이의 차 신호를 도출하는 단계; 및
- 상기 차 신호에 대한 예측 잔류 신호를, 상기 차 신호 및 상기 공간 파라미터들로부터 도출되는 예측 계수로 스케일링되는 모노 다운믹스 신호 사이의 차로서 도출하는 단계를 포함하는, 공간 파라미터들에 기초하여 레프트 신호 및 라이트 신호로부터 차 신호에 대한 예측 잔류 신호를 생성하기 위한 방법. - 합병된 모노 다운믹스 스트림, 파라미터 스트림, 및 예측 잔류 스트림을 포함하는, 데이터 비트스트림.
- 제 11 항, 제 12 항, 또는 제 16 항 중 어느 한 항에 따른 상기 방법을 실행하기 위한, 컴퓨터 프로그램 제품.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08156801.6 | 2008-05-23 | ||
EP08156801 | 2008-05-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110020846A true KR20110020846A (ko) | 2011-03-03 |
KR101629862B1 KR101629862B1 (ko) | 2016-06-24 |
Family
ID=40943873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107028681A KR101629862B1 (ko) | 2008-05-23 | 2009-05-14 | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 |
Country Status (10)
Country | Link |
---|---|
US (6) | US8811621B2 (ko) |
EP (1) | EP2283483B1 (ko) |
JP (1) | JP5122681B2 (ko) |
KR (1) | KR101629862B1 (ko) |
CN (1) | CN102037507B (ko) |
BR (3) | BRPI0908630B1 (ko) |
MX (1) | MX2010012580A (ko) |
RU (1) | RU2497204C2 (ko) |
TW (1) | TWI484477B (ko) |
WO (1) | WO2009141775A1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101391110B1 (ko) * | 2009-09-29 | 2014-04-30 | 돌비 인터네셔널 에이비 | 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림 |
KR101461110B1 (ko) * | 2013-09-06 | 2014-11-12 | 광주과학기술원 | 스테레오 확장장치 및 스테레오 확장방법 |
KR20200035119A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 |
KR20200035139A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품 |
KR20200035138A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품 |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4643453B2 (ja) | 2006-01-10 | 2011-03-02 | 株式会社東芝 | 情報処理装置及び情報処理装置の動画像復号方法 |
JP5122681B2 (ja) * | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
CN101826326B (zh) * | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
TWI444989B (zh) | 2010-01-22 | 2014-07-11 | Dolby Lab Licensing Corp | 針對改良多通道上混使用多通道解相關之技術 |
CN103811010B (zh) * | 2010-02-24 | 2017-04-12 | 弗劳恩霍夫应用研究促进协会 | 产生增强下混频信号的装置和产生增强下混频信号的方法 |
EP2375410B1 (en) | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
AU2016222372B2 (en) * | 2010-04-09 | 2018-06-28 | Dolby International Ab | Mdct-based complex prediction stereo coding |
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
PL3779975T3 (pl) | 2010-04-13 | 2023-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i powiązane sposoby przetwarzania wielokanałowych sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
CN102314882B (zh) * | 2010-06-30 | 2012-10-17 | 华为技术有限公司 | 声音信号通道间延时估计的方法及装置 |
JP2012100241A (ja) | 2010-10-05 | 2012-05-24 | Panasonic Corp | 画像編集装置、画像編集方法、及び、そのプログラム |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
US8654984B2 (en) | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
US9552818B2 (en) | 2012-06-14 | 2017-01-24 | Dolby International Ab | Smooth configuration switching for multichannel audio rendering based on a variable number of received channels |
MX350690B (es) | 2012-08-03 | 2017-09-13 | Fraunhofer Ges Forschung | Método y descodificador para un concepto paramétrico de codificación de objeto de audio espacial generalizado para casos de mezcla descendente/mezcla ascendente de multicanal. |
CA3234476A1 (en) | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
EP3933834A1 (en) | 2013-07-05 | 2022-01-05 | Dolby International AB | Enhanced soundfield coding using parametric component generation |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
WO2015059153A1 (en) | 2013-10-21 | 2015-04-30 | Dolby International Ab | Parametric reconstruction of audio signals |
AU2014339065B2 (en) | 2013-10-21 | 2017-04-20 | Dolby International Ab | Decorrelator structure for parametric reconstruction of audio signals |
CN103700372B (zh) * | 2013-12-30 | 2016-10-05 | 北京大学 | 一种基于正交解相关技术的参数立体声编码、解码方法 |
EP3540732B1 (en) * | 2014-10-31 | 2023-07-26 | Dolby International AB | Parametric decoding of multichannel audio signals |
EP3405951B1 (en) | 2016-01-22 | 2019-11-13 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
JP6817433B2 (ja) * | 2016-11-08 | 2021-01-20 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 少なくとも2つのチャンネルをダウンミックスするためのダウンミキサおよび方法ならびにマルチチャンネルエンコーダおよびマルチチャンネルデコーダ |
BR112019009315A2 (pt) * | 2016-11-08 | 2019-07-30 | Fraunhofer Ges Forschung | aparelho e método para mixagem de redução ou mixagem de aumento de um sinal de múltiplos canais com o uso de compensação de fase |
MX2019008008A (es) * | 2017-01-04 | 2019-12-16 | That Corp | Arquitectura configurable de compresor multibanda con procesamiento de sonido envolvente avanzado. |
US10877192B2 (en) | 2017-04-18 | 2020-12-29 | Saudi Arabian Oil Company | Method of fabricating smart photonic structures for material monitoring |
US10401155B2 (en) | 2017-05-12 | 2019-09-03 | Saudi Arabian Oil Company | Apparatus and method for smart material analysis |
CA3071208A1 (en) * | 2017-07-28 | 2019-01-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
WO2019121980A1 (en) | 2017-12-19 | 2019-06-27 | Dolby International Ab | Methods and apparatus systems for unified speech and audio decoding improvements |
KR20200099560A (ko) | 2017-12-19 | 2020-08-24 | 돌비 인터네셔널 에이비 | 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템 |
ES2909343T3 (es) | 2018-04-05 | 2022-05-06 | Fraunhofer Ges Forschung | Aparato, método o programa informático para estimar una diferencia de tiempo entre canales |
EP3913626A1 (en) * | 2018-04-05 | 2021-11-24 | Telefonaktiebolaget LM Ericsson (publ) | Support for generation of comfort noise |
WO2020009082A1 (ja) | 2018-07-03 | 2020-01-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
US10841689B2 (en) * | 2018-10-02 | 2020-11-17 | Harman International Industries, Incorporated | Loudspeaker and tower configuration |
BR112021010972A2 (pt) | 2018-12-07 | 2021-09-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho e método para gerar uma descrição de campo de som |
KR20220025107A (ko) * | 2019-06-14 | 2022-03-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 매개변수 인코딩 및 디코딩 |
EP4120249A4 (en) | 2020-03-09 | 2023-11-15 | Nippon Telegraph And Telephone Corporation | SOUND SIGNAL CODING METHOD, SOUND SIGNAL DECODING METHOD, SOUND SIGNAL CODING DEVICE, SOUND SIGNAL DECODING DEVICE, PROGRAM AND RECORDING MEDIUM |
WO2021181746A1 (ja) * | 2020-03-09 | 2021-09-16 | 日本電信電話株式会社 | 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体 |
WO2021181473A1 (ja) * | 2020-03-09 | 2021-09-16 | 日本電信電話株式会社 | 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体 |
US20230319498A1 (en) | 2020-03-09 | 2023-10-05 | Nippon Telegraph And Telephone Corporation | Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070107615A (ko) * | 2006-05-02 | 2007-11-07 | 한국전자통신연구원 | 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 |
KR20080033993A (ko) * | 2005-07-19 | 2008-04-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중 채널 오디오 신호들의 생성 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8913758D0 (en) | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US5488665A (en) * | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
WO2003085643A1 (en) * | 2002-04-10 | 2003-10-16 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
BR0304541A (pt) | 2002-04-22 | 2004-07-20 | Koninkl Philips Electronics Nv | Método e arranjo para sintetizar um primeiro e um segundo sinal de saìda a partir de um sinal de entrada, aparelho para prover um sinal de áudio decodificado, sinal de multicanal decodificado, e, meio de armazenamento |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
KR20060132697A (ko) * | 2004-02-16 | 2006-12-21 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 트랜스코더 및 트랜스코딩 방법 |
CN1938760B (zh) * | 2004-04-05 | 2012-05-23 | 皇家飞利浦电子股份有限公司 | 多通道编码器 |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
BRPI0517949B1 (pt) | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
JP5106115B2 (ja) * | 2004-11-30 | 2012-12-26 | アギア システムズ インコーポレーテッド | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
US8619998B2 (en) * | 2006-08-07 | 2013-12-31 | Creative Technology Ltd | Spatial audio enhancement processing method and apparatus |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
PL2068307T3 (pl) * | 2006-10-16 | 2012-07-31 | Dolby Int Ab | Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu |
US8200351B2 (en) * | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
CN101809654B (zh) * | 2007-04-26 | 2013-08-07 | 杜比国际公司 | 供合成输出信号的装置和方法 |
EP2023600A1 (en) | 2007-07-27 | 2009-02-11 | Thomson Licensing | Method of color mapping from non-convex source gamut into non-convex target gamut |
JP5122681B2 (ja) * | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
-
2009
- 2009-05-14 JP JP2011510076A patent/JP5122681B2/ja active Active
- 2009-05-14 BR BRPI0908630-7A patent/BRPI0908630B1/pt active IP Right Grant
- 2009-05-14 RU RU2010152580/08A patent/RU2497204C2/ru active
- 2009-05-14 US US12/992,317 patent/US8811621B2/en active Active
- 2009-05-14 BR BR122020009727-2A patent/BR122020009727B1/pt active IP Right Grant
- 2009-05-14 MX MX2010012580A patent/MX2010012580A/es active IP Right Grant
- 2009-05-14 KR KR1020107028681A patent/KR101629862B1/ko active IP Right Grant
- 2009-05-14 EP EP09750232A patent/EP2283483B1/en active Active
- 2009-05-14 BR BR122020009732-9A patent/BR122020009732B1/pt active IP Right Grant
- 2009-05-14 CN CN2009801187544A patent/CN102037507B/zh active Active
- 2009-05-14 WO PCT/IB2009/052009 patent/WO2009141775A1/en active Application Filing
- 2009-05-20 TW TW098116731A patent/TWI484477B/zh active
-
2014
- 2014-07-14 US US14/330,498 patent/US9591425B2/en active Active
-
2017
- 2017-01-20 US US15/411,127 patent/US10136237B2/en active Active
-
2018
- 2018-10-22 US US16/166,496 patent/US11019445B2/en active Active
-
2021
- 2021-05-19 US US17/324,420 patent/US11871205B2/en active Active
-
2023
- 2023-12-01 US US18/525,910 patent/US20240121567A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080033993A (ko) * | 2005-07-19 | 2008-04-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중 채널 오디오 신호들의 생성 |
KR20070107615A (ko) * | 2006-05-02 | 2007-11-07 | 한국전자통신연구원 | 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101391110B1 (ko) * | 2009-09-29 | 2014-04-30 | 돌비 인터네셔널 에이비 | 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림 |
KR101461110B1 (ko) * | 2013-09-06 | 2014-11-12 | 광주과학기술원 | 스테레오 확장장치 및 스테레오 확장방법 |
KR20200035119A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 |
KR20200035139A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품 |
KR20200035138A (ko) * | 2017-08-10 | 2020-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품 |
KR20220041233A (ko) * | 2017-08-10 | 2022-03-31 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 |
KR20220043246A (ko) * | 2017-08-10 | 2022-04-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품 |
KR20220048063A (ko) * | 2017-08-10 | 2022-04-19 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품 |
KR20230018550A (ko) * | 2017-08-10 | 2023-02-07 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품 |
KR20230020554A (ko) * | 2017-08-10 | 2023-02-10 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 |
US11640825B2 (en) | 2017-08-10 | 2023-05-02 | Huawei Technologies Co., Ltd. | Time-domain stereo encoding and decoding method and related product |
US11727943B2 (en) | 2017-08-10 | 2023-08-15 | Huawei Technologies Co., Ltd. | Time-domain stereo parameter encoding method and related product |
US11935547B2 (en) | 2017-08-10 | 2024-03-19 | Huawei Technologies Co., Ltd. | Method for determining audio coding/decoding mode and related product |
Also Published As
Publication number | Publication date |
---|---|
US20170134875A1 (en) | 2017-05-11 |
RU2010152580A (ru) | 2012-06-27 |
BRPI0908630A2 (pt) | 2017-10-03 |
EP2283483B1 (en) | 2013-03-13 |
US11871205B2 (en) | 2024-01-09 |
BR122020009727B1 (pt) | 2021-04-06 |
US20190058960A1 (en) | 2019-02-21 |
TWI484477B (zh) | 2015-05-11 |
TW201011736A (en) | 2010-03-16 |
US10136237B2 (en) | 2018-11-20 |
BRPI0908630A8 (pt) | 2017-12-12 |
US8811621B2 (en) | 2014-08-19 |
US20210274302A1 (en) | 2021-09-02 |
WO2009141775A1 (en) | 2009-11-26 |
RU2497204C2 (ru) | 2013-10-27 |
EP2283483A1 (en) | 2011-02-16 |
BRPI0908630B1 (pt) | 2020-09-15 |
MX2010012580A (es) | 2010-12-20 |
US20240121567A1 (en) | 2024-04-11 |
BR122020009732B1 (pt) | 2021-01-19 |
JP2011522472A (ja) | 2011-07-28 |
US20140321652A1 (en) | 2014-10-30 |
JP5122681B2 (ja) | 2013-01-16 |
CN102037507A (zh) | 2011-04-27 |
US9591425B2 (en) | 2017-03-07 |
US20110096932A1 (en) | 2011-04-28 |
KR101629862B1 (ko) | 2016-06-24 |
US11019445B2 (en) | 2021-05-25 |
CN102037507B (zh) | 2013-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101629862B1 (ko) | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 | |
JP6740496B2 (ja) | ステレオオーディオ信号を出力する装置及び方法 | |
JP6730438B2 (ja) | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 | |
RU2727799C1 (ru) | Устройство и способ понижающего или повышающего микширования многоканального сигнала с использованием фазовой компенсации | |
CA2809437C (en) | Apparatus for decoding a signal comprising transients using a combining unit and a mixer | |
CA2598541C (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
JP5358691B2 (ja) | 位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム | |
CA2887228C (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
EP2880654B1 (en) | Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases | |
AU2015201672B2 (en) | Apparatus for generating a decorrelated signal using transmitted phase information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190607 Year of fee payment: 4 |