KR100823097B1 - 멀티채널 신호를 처리하는 장치 및 방법 - Google Patents

멀티채널 신호를 처리하는 장치 및 방법 Download PDF

Info

Publication number
KR100823097B1
KR100823097B1 KR1020067016991A KR20067016991A KR100823097B1 KR 100823097 B1 KR100823097 B1 KR 100823097B1 KR 1020067016991 A KR1020067016991 A KR 1020067016991A KR 20067016991 A KR20067016991 A KR 20067016991A KR 100823097 B1 KR100823097 B1 KR 100823097B1
Authority
KR
South Korea
Prior art keywords
channel
prediction
similarity
channels
spectral
Prior art date
Application number
KR1020067016991A
Other languages
English (en)
Other versions
KR20060121982A (ko
Inventor
쥬르겐 헤르
미첼 슈그
알렉산더 그로셀
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20060121982A publication Critical patent/KR20060121982A/ko
Application granted granted Critical
Publication of KR100823097B1 publication Critical patent/KR100823097B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Stereophonic System (AREA)
  • Radio Relay Systems (AREA)
  • Detergent Compositions (AREA)
  • Color Image Communication Systems (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)

Abstract

멀티채널 신호를 처리하는 장치는 2개 채널 중의 하나인 제1 채널과 2개 채널 중의 하나인 제2 채널의 유사성을 결정하는 수단(12)을 포함한다. 또한, 스펙트럼 계수의 예측 필터링을 수행하는 수단(16)을 구비하며, 이는 제1과 제2 채널 사이의 유사성이 높을 때 양쪽 채널에 대해 단지 하나의 예측 필터(16a)로 예측 필터링을 수행하고, 제1 및 제2채널 사이가 비유사적일 때 2개의 별도 예측 필터(16b)로 예측 필터링을 수행하도록 형성된다. 그럼으로써, 스테레오 코딩 기술에서 스테레오 인공음의 도입과 코딩 이득의 저하가 회피된다.
공동 필터, 예측 필터링, 채널 유사성, 코딩 기술

Description

멀티채널 신호를 처리하는 장치 및 방법{Device and method for processing a multi-channel signal}
본 발명은 오디오 코더에 관한 것으로서, 특히 임시 표현에서 스펙트럼 표현의 변환이 코더 파이프라인(pipeline)의 시작에서 발생하는, 변환-기반(transformation-based) 오디오 코더에 관한 것이다.
공지의 변환-기반 오디오 코더가 도 3에 도시된다. 도 3의 코더는 국제 표준 ISO/IEC 14496-3: 2001 (E), 서브파트(subpart) 4, 페이지 4에 나타나 있고, 또한 AAC 코더로 알려져 있다.
종래 기술의 코더가 하기에서 설명된다. 코딩되는 오디오 신호가 입력단(1000)으로 제공된다. 이 오디오 신호는 처음에 스케일링 스테이지(scaling stage: 1002)로 제공되며, 여기서 소위 AAC 이득 제어(gain control)가 수행되어 오디오 신호의 레벨을 확립한다. 스케일링으로부터의 부가정보(Side information)가 비트스트림 포매터(1004)로 제공되며, 이는 블록(1002)과 블록(1004) 사이에 위치하는 화살표에 의해 표시되고 있다. 스케일링된 오디오 신호는 이어서 MDCT 필터 뱅크(1006)로 제공된다. AAC 코더와 더불어, 필터뱅크는 50% 오버랩핑된 윈도우를 갖는 수정된 이산 코사인 변환을 수행하며, 윈도우의 길이는 블록(1008)에 의해 결정된다.
일반적으로, 블록(1008)은 상대적으로 짧은 윈도우를 가지는 과도 신호를 윈도윙하고, 상대적으로 긴 윈도우를 가지는 고정적인 경향의 신호를 윈도윙하기 위해서 존재한다. 이는 과도 신호에 대해서는 상대적으로 짧은 윈도우 때문에 (주파수 해상도의 희생 하에) 더 높은 시간 해상도에 이르도록 역할하고, 반면에 고정적인 경향의 신호에 대해서는 긴 윈도우 때문에 (시간 해상도의 희생 하에) 더 높은 주파수 해상도가 얻어지며, 더 높은 코딩 이득을 얻기 때문에 더 긴 윈도우를 선호하는 경향이 있다. 필터뱅크(1006)의 출력단에는, 스펙트럼 값의 블록들이 -이들 블록들은 시간적으로 연속한다- 존재하며, 이는 MDCT 계수, 푸리에(Fourier) 계수 또는 서브밴브 신호(subband signal)일 수 있으며, 필터뱅크의 실행에 따라, 각 서브밴드 신호는 필터뱅크(1006)의 각 서브밴드 채널에 의해 특정된 특정한 한계 대역폭을 갖고, 또한 각 서브밴드 신호는 서브밴드 샘플의 특정한 수를 가진다.
예시를 위해서, 필터뱅크가 MDCT 스펙트럼 계수의 일시적으로 연속하는 블록을 출력하는 경우에 대해 설명된다. 이는 일반적으로, 입력단(1000)에서 인코딩되는 오디오 신호의 연속적인 숏텀(short-term) 스펙트럼들을 나타낸다. 이어 MDCT스펙트럼 값의 블록이 TNS(temporary noise shaping) 프로세싱 블록(1010)으로 제공되며, 여기에서 일시적 잡음 형성이 수행된다. TNS 기술이 각 윈도우 변환 내에서 양자화 잡음의 일시적 형태를 형성하는데 이용된다. 이는 각 채널의 스펙트럼 데이 터의 일부분에 필터링 프로세스를 인가함으로써 이루어진다. 코딩이 윈도우 베이시스(window basis)에서 수행된다. 특히, 다음 단계는 TNS 툴(tool)을 스펙트럼 데이터의 윈도우에, 즉 스펙트럼 값의 블록에 인가하도록 수행된다.
처음에, TNS 툴을 위한 주파수 범위가 선택된다. 적합한 선택은 필터를 가지고 1.5kHz의 주파수 범위에서, 최고 유효 스케일 팩터 밴드(scale factor band)까지 적용하는 것을 포함한다. 이러한 주파수 범위는, AAC 표준(ISO/IEC 14496-3: 2001 (E))에 명시된 바와 같이, 표본 추출 비율(sampling rate)에 따른 다는 것을 주의하여야 한다.
이어서, LPC(linear predictive coding: 선형 예측 부호화) 계산이 수행되며, 선택된 목표 주파수 범위에 존재하는 스펙트럼 MDCT 계수들을 이용하여 정확하게 된다. 안전성을 높이기 위해, 2.5kHz 이하의 주파수들에 해당하는 계수들은 이 프로세스에서 배제된다. 음성 처리(speech processing)로부터 알려진 통상의 LPC 프로시저(procedure)가 LPC 계산을 위해 이용될 수 있으며, 예를 들어 공지의 레빈슨-더빈(Levinson-Durbin) 알고리즘이 그러하다. 계산은 잡음 형성 필터(noise-shaping filter)의 최대 허용 차수(order)에 대해 수행된다.
LPC 계산의 결과로 기대 예측 이득PG이 얻어진다. 추가적으로, 반사계수(reflection coefficient)들, 또는 파코계수(Parcor coefficient)들이 얻어진다.
만약 예측 이득이 특정 쓰레쉬홀드(threshold)를 초과하지 않는다면, TNS 툴은 적용되지 않는다. 이 경우에, 한 조각의 제어 정보가 비트스트림으로 기입되고, 디코더는 TNS 프로세싱이 수행되지 않았음을 인지한다.
그러나, 만약 예측 이득이 쓰레쉬홀드를 초과한다면, TNS 프로세싱이 적용된다.
다음 단계에서, 반사계수가 양자화된다. 사용된 잡음 형성 필터의 차수는 쓰레쉬홀드 보다 작은 절대 값을 갖는 모든 반사계수들을 반사계수 어레이의 "꼬리(tail)"로부터 제거함으로써 결정된다. 잔류 반사계수의 수는 잡음 형성 필터의 매그니튜드 차수이다. 적절한 쓰레쉬홀드는 0.1이다.
잔류 반사계수들은 전형적으로 선형 예측 계수들로 변환되며, 이러한 기술 역시 "스텝업(step-up)" 프로시저로서 알려져 있다.
계산된 LPC 계수들은 이어 코더 잡음 형성 필터 계수, 즉 예측 필터 계수로서 이용된다. 이 FIR 필터가 특정 목표 주파수 범위에서 필터링하는데 이용된다. 자기회귀 필터(autoregressive filter)가 디코딩에 이용되는 반면, 소위 이동평균 필터(moving average filter)가 코딩에 이용된다. 최종적으로, TNS 툴을 위한 부가정보가 비트스트림 포매터로 제공되고, 이는 도 3에서 TNS 프로세싱 블록(1010)과 비트스트림 포매터(1004) 사이에 도시된 화살표로 나타내었다.
이어, 도 3에는 도시되지 않은 여러 개의 옵션 툴들, 이를테면 롱텀(long-term) 예측 툴, 강도/커플링(intensity/coupling) 툴, 예측 툴, 잡음 치환(noise substitution) 툴을 통과하고, 최종적으로 미드/사이드(mid/side) 코더(1012)에 도달한다. 미드/사이드 코더(1012)는 코딩되는 오디오 신호가 멀티채널, 즉 좌측채널과 우측채널을 가지는 스테레오 신호일 때 동작한다. 지금까지, 즉 도 3의 블록(1012)의 업스트림까지 좌측 및 우측 스테레오 채널이 처리되었으며, 즉, 서로 분리되어 스케일되고, 필터뱅크에 의해 변환되고, TNS 프로세싱을 통과하거나 통과하지 않는 등등의 처리들이 되었다.
미드/사이드 코더에서, 먼저 미드/사이드 코딩이 타당한가, 즉 조금이라도 코딩 이득을 가져올 것인가의 여부에 대한 검증이 수행된다. 만약 좌측 및 우측 채널이 유사하다면, 미드/사이드 코딩은 코딩 이득을 낼 것이며, 이 경우에, 미드 채널(mid channel), 즉 좌측 및 우측 채널의 합계는, 1/2 인수로 스케일링하는 것과는 별개로, 거의 좌측 채널 또는 우측 채널과 같기 때문이다. 반면에 사이드 채널은, 좌측과 우측 채널 간의 차와 같기 때문에 단지 아주 작은 값을 가진다. 결과적으로, 좌측과 우측 채널이 대략 같을 때, 차는 대략 0이거나, 단지 매우 작은 값을 포함한다는 것을 알 수 있을 것이며, 이 작은 값은 -이는 희망사항이다- 이후의 양자화기(1014: quantizer)에서 0으로 양자화되고, 엔트로피 코더(1016)가 양자화기(1014) 이후에 연결되기 때문에 매우 효율적인 방식으로 전송될 수 있을 것이다.
양자화기(1014)는 음향심리 모델(1020: psycho-acoustic model)에 의해 스케일 팩터 밴드 당 허용 가능한 간섭을 제공받는다. 양자화기는 반복적 방식으로 동작하는데, 즉 처음에는 외부 반복 루프가 호출되고, 다음에 내부 반복 루프가 호출된다. 일반적으로, 양자화 스텝사이즈 시작 값으로부터 시작하면, 블록 값의 양자화가 처음에 양자화기(1014)의 입력단에서 수행된다. 특히, 내부 루프는 MDCT 계수들을 양자화하며, 이 과정에서 비트의 특정 수가 소비된다. 외부 루프는 다시 내부 루프를 호출하기 위해서 스케일 팩터를 이용하여 계수들의 왜곡 및 수정된 에너지를 계산한다. 이 과정은 특정한 조건절이 만족될 때까지의 시간 동안 반복된다. 외 부 반복 루프에서의 각 반복 동안, 양자화에 의해 도입된 간섭을 계산하고 음향심리 모델(1020)에 의해 제공된 허용된 간섭과 비교하도록 신호가 복원된다. 추가적으로, 이러한 비교 이후에도 여전히 간섭된다고 여겨지는 주파수 대역들의 스케일 팩터들은 하나 이상의 스테이지에서 반복과 반복에 의해서 확대되어서, 외부 반복 루프의 각 반복 동안 정확하게 된다.
일단 양자화에 의해 도입된 양자화 간섭이 음향심리 모델에 의해 결정된 허용된 간섭 이하인 상태에 도달하고 동시에 비트 요구가 충족된다면, 최대 비트 율이 초과되지 않고, 반복, 즉 분석-합성(analysis-by-synthesis) 방법이 종료되며, 얻어진 스케일 팩터들이 블록(1004)에 도시한 바와 같이 코딩되어 코딩된 형태로 블록(1014)과 블록(1004) 사이에 도시된 화살표에 의해 나타낸 바와 같이 비트스트림 포매터(1004)로 제공되는 것들이 정확하게 되는 것이다. 이어 양자화된 값들은 엔트로피 코더(1016)로 제공되며, 이는 전형적으로 여러 개의 허프만 코드(Huffman-code) 테이블을 이용하여 다양한 스케일 팩터 밴드에 대해 엔트로피 코딩을 수행하여, 양자화된 값들을 2진(binary) 포맷으로 번역한다. 공지된 바와 같이, 허프만 코딩 형태의 엔트로피 코딩은 예상 신호 통계에 기반을 두고 생성된 코드 테이블에 의존하는 것을 포함하며, 여기서 덜 발생하는 값 보다 더 자주 발생하는 값들에게 더 짧은 코드 워드가 주어진다. 엔트로피 코딩된 값들은 이어, 실제 메인 정보로서, 비트스트림 포매터(1004)에 제공되고, 이는 이어 코딩된 오디오 신호를 특정 비트스트림 구문에 따라 출력단 측에서 출력한다.
이미 언급한 바와 같이, 예측 필터링이 TNS 프로세싱 블록(1010)의 코딩 프 레임 내에서 양자화 잡음의 일시적 형성을 위해 이용된다.
특히, 양자화 잡음의 일시적 형성은, 양자화 및 이어지는 디코더에서의 역 필터링 이전에 인코더에서의 주파수 전체에 걸쳐서 스펙트럼 계수를 필터링함으로써 수행된다. 프리-에코 인공음을 회피하기 위해서, TNS 프로세싱은 양자화 잡음의 포락선이 신호의 포락선 이하로 시간 시프트되도록 한다. TNS의 응용은, 상술한 바와 같이, 필터링의 예측의 평가로부터 얻어진다. 각 코딩 프레임에 대한 필터 계수들은 상관 측도(correlation measure)를 통해 결정된다. 필터 계수의 계산은 각 채널에 대해 별도로 행해진다. 그들은 또한 인코딩된 비트스트림에서 별도로 전송된다.
TNS 컨셉의 활성/정지에 있어서 단점은, 양호하게 기대된 코딩 이득으로 인해, 일단 TNS 프로세싱이 활성화되면, 각 스테레오 채널에 대해 TNS 필터링이 각 채널에 대해 별도로 일어난다는 것이다. 이는 상대적으로 다른 채널에 대해서는 아직 문제가 되지 않는다. 그러나 만약 좌측 및 우측 채널이 상대적으로 유사하다면, 즉 극단적인 예로서 스피커와 같이 불가피하게 채널에 포함된 잡음만 다르고 좌측 및 우측 채널이 정확히 동일한 유용 정보를 가진다면, TNS필터는 여전히 각 채널에 대해서 계산되며, 이는 종래기술에서 그렇게 이용된다. TNS 필터는 좌측 및/또는 우측 채널에 직접적으로 의존하고, 특히 좌측 및 우측 채널의 스펙트럼 데이터에 상대적으로 민감하게 반응하기 때문에, 좌측 및 우측 채널이 매우 유사한, 이를테면 소위 "콰지모노(quasi-mono) 신호"의 경우에, 그 자체의 예측 필터를 가지는 TNS 프로세싱이 각 채널에 대해서 수행된다. 이는 다른 필터 계수로 인해 2개의 스 테레오 채널에서 발생하는 다른 일시적 잡음 형성을 야기한다.
예를 들어 오리지날 모노-성(mono-like) 사운드 임프레션(impression) 이 이들 일시적 차이를 통해 바람직하지 않은 스테레오 특성을 얻기 때문에, 그것이 가청 인공음을 야기할 수 있다는 것은 이러한 효과에 있어서 단점이다.
그러나, 공지의 프로시저(procedure)는 훨씬 더 심각한 단점을 갖는다. TNS 프로세싱에 의해, TNS 출력 값, 즉 스펙트럼 잔류 값이 도 3의 미드/사이드(mid/side) 코더(1002)에서 미드/사이드 코딩된다. TNS 프로세싱 이전에는 2개의 채널은 여전히 상대적으로 동일하지만, TNS 프로세싱 이후에는 더 이상 그렇다고 할 수 없다. 별도의 TNS 프로세싱에 의해 도입된, 상술한 이 스테레오 효과에 의해, 2개 채널의 스펙트럼 잔류 값은, 실제보다 더 비유사적(dissimilar)으로 된다. 이는, 미드/사이드 코딩으로 인해, 코딩 이득의 즉각적인 강하를 일으키며, 이는 특히 저비트율이 요구되는 애플리케이션에 대해서 특히 불리하다.
따라서 요약하면, 공지의 TNS 활성은, 모노-성 음성 신호와 같이, 양쪽 채널에서 유사하지만 정확히 동일하지 않은 신호 정보를 이용하는 스테레오 신호에 대해서는 문제가 있다. TNS 검출에서 2개 채널에 대해 다른 필터 계수가 결정되는 한, 이는 채널에서의 양자화 잡음의 일시적인 다른 형성을 일으킨다. 이는 가청 인공음을 야기할 수 있는데, 예를 들어 이들 일시적인 차이를 통해 오리지널 모노-성 사운드 임프레션이 바람직하지 못한 스테레오 특성을 얻기 때문이다. 더욱이, 상술한 바와 같이, TNS-수정 스펙트럼은 후속 단계에서 미드/사이드 코딩이 행해진다. 양쪽 채널에서의 다른 필터는 추가적으로 스펙트럼 계수의 유사성을 감소시키고, 미드/사이드 이득을 감소시킨다.
특허문헌 독일 19829284C2호는 일시적 스테레오 신호를 처리하는 방법 및 장치, 그리고 주파수 전체에 걸친 예측을 이용하여 인코딩된 오디오 비트 스트림을 디코딩하는 방법 및 장치에 대해서 개시하고 있다. 실시예에 따르면, 좌측, 우측, 및 모노 채널은 주파수 전체에 걸친 그들 자체의 예측, 즉 TNS 프로세싱을 통과할 수 있다. 따라서, 각 채널에 대해 그들 자체의 완전한 예측이 수행될 수 있다. 대안적으로, 불완전한 예측에서는, 좌측 채널에 대한 예측 계수의 계산이 발생할 수 있고, 이는 우측 채널 및 모노 채널의 필터링에 적용된다.
본 발명의 목적은, 더 적은 인공음을 가지지만 양호한 정보의 압축을 가능하게 하는, 멀티채널을 처리하는 컨셉을 제공하는 것이다.
상술한 본 발명의 목적은 청구항1의 멀티채널 신호를 처리하는 장치, 청구항11의 멀티채널 신호를 처리하는 방법, 또는 청구항 12의 컴퓨터 프로그램에 의해 달성된다.
본 발명은 다음과 같은 연구결과에 기반을 두고 있다. 만약 좌측과 우측 채널이 유사하다면, 즉 유사성 측도(similarity measure)를 초과한다면, 동일한 TNS 필터링이 양쪽 채널에 적용된다. 이를 통해, TNS 프로세싱에 의해 의사-스테레오(pseudo-stereo) 인공음이 멀티채널 신호로 도입되지 않는 것이 보장되며, 이는 양쪽 채널에 대해 동일한 예측 필터를 사용함으로써, 양자화 잡음의 일시적 형성이 또한 양쪽 채널에 대해 동일하게 일어나며, 다시 말해서, 어떤 의사-스테레오 인공음이 들리지 않기 때문이다.
더욱이, 신호들이 실제 보다 더 비유사적으로 되지 않는 것이 보장된다. TNS 필터링 이후에 신호의 유사성, 즉 스펙트럼 잔류 값의 유사성이 여기서는 필터로 입력된 입력 신호의 유사성과 대응되며, 다른 필터에 의해 입력 신호의 유사성이 여전히 감소되는 종래 기술과는 다르다.
따라서, 신호들이 실제 보다 더 비유사적으로 되지 않았기 때문에, 후속 미드/사이드 코딩은 비트 레이트 손실을 입지 않을 것이다.
물론, 양쪽 채널에 대해 동일한 예측 필터를 이용함으로써, 예측 이득에서의 작은 손실이 발생할 것이다. 그러나, 이러한 손실은 그다지 크지 않을 것인데, 이는 양쪽 채널에 대한 TNS 필터링의 동기화가 결국 단지 2개의 채널이 유사할 때에만 적용되기 때문이다. 그러나, 이러한 예측 이득의 작은 손실은, 밝혀진 바와 같이, 미드/사이드 이득에 의해 쉽게 균형을 잡게 되며, 이는 미드/사이드 코딩 이득의 감소를 야기하는, 좌측과 우측 채널 사이의 추가적인 비유사성(dissimilarity)이 TNS 프로세싱에 의해서 도입되는 일이 없기 때문이다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예가 상세하게 설명된다.
도 1은 본 발명에 따른 멀티채널 신호를 처리하는 장치의 블록 회로도이다.
도 2는 유사성을 결정하는 수단 및 예측 필터링을 형성하는 수단에 대한 바람직한 실시예를 보여주는 도면이다.
도 3은 AAC 표준에 따른 공지의 오디오 코더의 블록 회로도이다.
도 1은 멀티채널 신호를 처리하는 장치를 보여주는 도면으로서, 여기서 멀티채널 신호는, L과 R로 나타낸 적어도 2개의 채널의 각각에 대한 하나씩의 스펙트럼 값의 블록으로 나타낸다. 스펙트럼 값의 블록들은 예를 들어 MDCT 필터뱅크(10)를 이용한 MDCT 필터링에 의해, 각 채널에 대한 시간 도메인 샘플 l(t) 및/또는 r(t)로부터 결정된다.
본 발명의 바람직한 실시예에서, 각 채널에 대한 스펙트럼 값은, 이어서 2개의 채널 간의 유사성을 결정하는 수단(12)으로 제공된다. 대안적으로, 2개의 채널 사이의 유사성을 결정하는 수단은 또한, 도 1에 도시한 바와 같이, 각 채널에 대한 시간 도메인 샘플 l(t) 또는 r(t)을 이용하여 수행될 수도 있다. 그러나, 유사성 결정 대해 필터뱅크(10)로부터 얻어진 스펙트럼 값 블록을 이용하는 것이 바람직한다. 이는 그들이 필터뱅크(10)에서의 가능한 필터링 효과에 의해 동일하게 영향 받기 때문이다.
제1채널과 제2채널 사이의 유사성을 결정하는 수단(12)은, 유사성 측도 또는 대안적으로는 비유사성 측도에 근거해서, 제어 라인(14)에, 적어도 2개 상태를 가지는 제어 신호를 발생하도록 동작한다. 그 중 하나는 2 개 채널의 스펙트럼 값 블 록들이 유사하다는 것을 표현하는 것이고, 나머지는 각 채널에 대한 스펙트럼 값 블록들이 비유사적이라는 다른 상태를 나타내는 것이다. 유사성과 비유사성 중 어느 것이 우세한 지에 관한 결정은 바람직하게는 수치적인 유사성 측도를 이용하여 이루어질 수 있다.
각 채널에 대한 스펙트럼 값의 2개 블록 사이의 유사성 결정에 대해서 다양한 가능성이 있으며, 그 중 하나의 가능성은, 소정의 유사성 쓰레쉬홀드와 비교될 수 있는 값을 산출하는 교차 상관 계산(cross correlation calculation)이다. 대안적인 유사성 측정 방법은 하기에서 설명되는 바람직한 형태로 알려져 있다.
좌측 채널에 대한 스펙트럼 값 블록과 우측 채널에 대한 스펙트럼 값 블록 모두는 예측 필터링을 수행하는 수단(16)에 제공된다. 특히, 예측 필터링은 주파수 전체에 걸쳐서 수행되며, 유사성이 쓰레쉬홀드 유사성 보다 클 때, 수행하는 수단은 주파수 전체에 걸쳐서 예측을 수행하기 위해, 제1채널의 스펙트럼 값 블록 및 제2채널의 스펙트럼 값 블록에 대해서, 공동(common) 예측 필터(16a)를 이용하도록 형성된다. 그러나, 만약 예측 필터링을 수행하는 수단(16)이 유사성을 결정하는 수단(12)로부터 각 채널에 대한 스펙트럼 값의 2개 블록이 비유사적, 즉 쓰레쉬홀드 유사성 보다 작은 유사성을 갖는다고 통보 받으면, 예측 필터링을 수행하는 수단(16)은 좌측 및 우측 채널에 다른 필터(16b)를 적용할 것이다.
따라서, 수단(16)의 출력 신호가 출력단(18a)에서는 좌측 채널의 스펙트럼 잔류 값이고 출력단(18b)에서는 우측 채널의 스펙트럼 잔류 값이며, 여기서 2개 채널의 스펙트럼 잔류 값들은, 좌측과 우측 채널의 유사성에 따라, 동일한 예측 필 터(16a의 경우)를 이용하거나, 또는 다른 예측 필터(16b의 경우)를 이용하여 발생되었던 것이다.
실제 코더의 적용에 따르면, 좌측과 우측 채널의 스펙트럼 잔류 값은, 직접 또는 AAC 표준에 있는 것 같은 몇 가지의 프로세싱 이후에, 미드/사이드 스테레오 코더에 제공될 수 있으며, 이 코더는 출력단(21a)에서 좌측과 우측 채널 합의 절반만큼의 미드 신호를 출력하고, 반면에 사이드 신호는 좌측과 우측 채널 차의 절반만큼 출력된다.
상술한 바와 같이, 이전의 채널들이 높은 유사성을 가질 경우, 사이드 신호는 이제 그 경우에서 보다 더 작으며, 두 채널의 TNS 프로세싱의 동기화로 인해, 다른 TNS 필터들이 유사한 채널들에 이용되고, 따라서 사이드 신호가 더 작다는 사실로 인해, 더 높은 코딩 이득에 대한 기대를 갖게 된다.
다음에, 도 2를 참조하여, 본 발명의 바람직한 실시예가 설명된다. 블록(12a, 12b)로 나타낸 바와 같이, 유사성을 결정하는 수단(12)에서 TNS 계산의 첫 번째 스테이지가 이미 수행되고, 즉, 파코 및/또는 반사 계수의 계산, 그리고 좌측 채널과 우측 채널 모두의 예측 이득의 계산이 수행된다.
따라서, 이 TNS 프로세싱은 마지막에 이용되는 예측 필터에 대한 필터 계수와 예측 이득 모두를 제공하며, 이 예측 이득은 또한 TNS 프로세싱이 조금이라도 수행되어야 하는지 그렇지 않은지에 대한 결정에 필요하다.
도 2의 PG1으로 나타낸 제1, 좌측 채널에 대한 예측 이득은, 도2에서 도면 부호 (12C)로 나타낸 유사성 측도 결정 수단으로 공급되며, 이는 도2에서 PG2로 나 타낸 우측 채널에 대한 예측 이득도 마찬가지이다. 이러한 유사성 결정 수단은 차(difference)의 절대 매그니튜드 또는 2개의 예측 이득의 상대적인 차이를 계산하고, 그것이 소정 이탈 쓰레쉬홀드(deviation threshold) S의 이하인지 주시한다. 만약 예측 이득의 차의 절대 매그니튜드가 쓰레쉬홀드 S 이하라면, 2개 신호가 유사하다고 추정하고, 블록(12)에서의 질문에 예라고 답한다. 그러나, 만일 차가 유사성 쓰레쉬홀드 S 보다 크다는 것이 확인된다면, 질문에 아니오 라고 답한다. 질문에 대해 긍정적인 대답이 있는 경우, 채널 L과 R 둘 다에 대한 공동(common) 필터가 수단(16)에서 이용된다. 반면에 블록(12c)에서 질문에 대해 부정적인 대답이 있는 경우 별도의 필터가 이용될 수 있으며, 다시 말해서 종래 기술과 같이 TNS 프로세싱이 수행될 수 있는 것이다.
이를 위해, 좌측 채널에 대한 필터 계수 FKL세트와 우측 채널에 대한 필터 계수 FKR세트가 수단(12a 및/또는 12b)로부터 수단(16)으로 제공된다.
본 발명의 바람직한 실시예에서, 공동 필터를 이용하여 필터링하는 블록(16c)에서, 특별한 선택이 이루어진다. 블록(16c)에서, 어느 채널이 더 큰 에너지를 가지고 있는지가 결정된다. 만일 좌측 채널이 더 큰 에너지를 가지고 있다고 확인되면, 수단(12a)에 의해 좌측 채널에 대해 개산된 필터 계수 FKL 이 공동 필터링을 위해 이용된다. 그러나 만약 블록(16c)에서 우측 채널이 더 큰 에너지를 가지고 있다고 확인되면, 수단(12b)에서 우측 채널에 대해 계산되었던 필터 계수가 공동 필터링에 이용된다.
도 2에서 알 수 있는 바와 같이, 시간 신호와 스펙트럼 신호 둘 다는 에너지 결정에 이용될 수 있다. 어쩌면 발생하였을 변환 인공음이 이미 스펙트럼 신호에 포함되었다는 사실 때문에, 블록(16c)에서의 "에너지 결정(energy decision)"을 위해 좌측 및 우측 채널의 스펙트럼 신호를 이용하는 것이 바람직하다.
본 발명의 바람직한 실시예에서, 만약 좌측과 우측 채널의 다름이 3 퍼센트 이하라면, TNS 동기화, 즉 양쪽 채널에 대해 동일한 필터 계수를 이용하는 것이 적용될 수 있다. 만약 양쪽 채널이 3 퍼센트 이상 다르다면, 도 2의 블록(12c)에서의 질문은 "아니오" 라고 답해진다.
상술한 바와 같이, 2개 채널의 예측 이득이 유사성의 필터링 강도 검출-단순하거나 약간의 컴퓨테이션 정도로-에서 비교된다. 예측 이득의 차가 어느 쓰레쉬홀드 이하이면, 상술한 문제들을 회피하기 위해, 양쪽 채널에 동일한 TNS 필터링이 부여된다.
대안적으로, 2개의 별도로 계산된 TNS 필터의 반사 계수의 비교가 또한 행해질 수 있다.
또한 대안적으로, 유사성 결정이 신호의 다른 세부항목을 이용하여 이루어질 수 있다. 그럼으로써, 유사성이 결정되었을 때, 양쪽 스테레오 채널의 예측 필터링에 적용될, 채널에 대해 설정된 TNS 필터 계수만이 계산되면 된다. 이는 도 2를 보면 신호가 유사할 경우, 단지 블록(12a)와 블록(12b)만이 활성된다는 이점을 갖는다.
더욱이, 본 발명의 컨셉은 인코딩된 신호의 비트레이트 율을 더 줄이기 위해서 더 적용될 수 있다. 다른 TNS 부가 정보가2개의 다른 반사 계수의 사용으로 전 송되는 반면에, 양쪽 채널에 대한 TNS 정보는 동일한 예측 필터를 가지는 2개 채널의 필터링에 한번 전송되기만 하면 된다. 그러므로, 본 발명의 컨셉에 의해, 좌측과 우측 채널이 유사하다면, TNS 부가 정보가 "절약(saved)"되는, 비트레이트의 감소가 이루어질 수 있다.
본 발명의 컨셉은 기본적으로 스테레오 신호에 제한되지 않고, 다양한 채널 쌍에 둘러싸인 멀티채널 환경 또는 2채널 이상의 그룹에 적용될 수 있다.
설명한 바와 같이, 좌측과 우측 채널 사이의 교차 상관 측도 k 또는 예측 이득, 그리고 TNS 필터 계수의 결정은 유사성 결정을 위해 각 채널에 대해 별도로 행해질 수 있다.
만일 k가 쓰레쉬홀드(예를 들어 0.6)를 초과하고 MS 스테레오 코딩이 활성된다면, 동기화 결정이 행해질 수 있다. MS 기준은 또한 생략될 수 있다.
참조 채널의 결정이 동기화에서 행해질 수 있으며, 참조 채널의 TNS 필터는 다른 채널에 대해 채택되어 진다. 예를 들어, 더 큰 에너지를 가지는 채널이 참조 채널로 이용된다. 그러면 특히, 참조 채널로부터 다른 채널로 TNS 필터 계수의 복사가 행해진다.
마지막으로, 스펙트럼에 동기화되거나 동기화되지 않은 TNS 필터의 응용이 있을 수 있다.
대안적으로, TNS 예측 이득 및 TNS 필터 계수에 대한 결정이 각 채널에 대해 별도로 행해질 수 있다. 그러면, 결정이 이루어진다. 만약 양쪽 채널의 예측 이득의 다름이 어느 측도, 예를 들어 3% 이하라면, 동기화가 행해진다. 여기서, 만일 채널들의 유사성이 추정될 수 있다면, 참조 채널이 또한 임의적으로 선택될 수 있다. 여기서 또한 참조 채널로부터 다른 채널로 TNS 필터 계수의 복사가 있을 수 있고, 그에 더해 스펙트럼에 동기화되거나 동기화되지 않은 TNS 필터의 응용이 있을 수 있다.
다음은 대안적인 가능성들이다: 채널의 TNS가 원칙에 따라 활성되었는지 여부는 그 채널의 예측 이득에 근거한다. 만일 그것이 어느 쓰레쉬홀드를 초과한다면, TNS는 그 채널에 대해 활성된다. 대안적으로, TNS가 양쪽 채널 중 어느 하나에서만 활성되었다면, 2개 채널에 대한 TNS 동기화가 또한 이루어진다. 이어, 예를 들어, 예측 이득이 유사하고, 즉 한 채널이 활성화 한계의 바로 위에 있고, 한 채널이 활성화 한계 바로 아래에 있다는 것은 조건이다. 이어, 이러한 비교로부터, 동일한 계수를 가지는 양쪽 채널에 대한 TNS의 활성화가 유도되거나, 또는 아마도 양쪽 채널에 대해서 정지(deactivation)가 유도된다.
상황에 따라서, 멀티채널 신호를 처리하는 본 발명의 방법은 하드웨어 또는 소프트웨어로 구현될 수 있다. 이러한 구현은 본 발명이 실행될 수 있도록 디지털 저장 매체, 특히 프로그램이 가능한 컴퓨터 시스템에서 이용 가능한, 전자적으로 판독할 수 있는 플로피 디스크나 CD에서 구현될 수 있다. 따라서 일반적으로, 본 발명은 또한 그것이 컴퓨터에서 실행될 때 본 발명의 방법을 수행하는, 기계판독형 캐리어(machine-readable carrier)에 저장된 프로그램 코드를 가지는 컴퓨터 프로그램 제품으로 이루어진다. 바꿔 말하면, 본 발명은 또한 그것이 컴퓨터에서 실행 될 때 본 발명을 수행하는 프로그램 코드를 가지는 컴퓨터 프로그램으로서 실현될 수 있다.
멀티채널 신호를 처리하는 장치는 2개 채널 중의 하나인 제1 채널과 2개 채널 중의 하나인 제2 채널의 유사성을 결정하는 수단(12)을 포함한다. 또한, 스펙트럼 계수의 예측 필터링을 수행하는 수단(16)을 구비하며, 이는 제1과 제2 채널 사이의 유사성이 높을 때 양쪽 채널에 대해 단지 하나의 예측 필터(16a)로 예측 필터링을 수행하고, 제1 및 제2채널 사이가 비유사적일 때 2개의 별도 예측 필터(16b)로 예측 필터링을 수행하도록 형성된다. 그럼으로써, 스테레오 코딩 기술에서 스테레오 인공음의 도입과 코딩 이득의 저하가 회피된다.

Claims (12)

  1. 멀티채널 신호를 처리하는 장치로서, 상기 멀티 채널은 적어도 2개의 채널 각각에 대한 스펙트럼 값의 블록으로 나타내는, 멀티채널 신호를 처리하는 장치에 있어서:
    상기 2개의 채널 중의 하나인 제1채널과 상기 2개의 채널 중의 하나인 제2채널 사이의 유사성을 결정하는 수단(12)으로서, 상기 유사성을 결정하는 수단(12)은 상기 제1채널의 상기 블록의 예측으로부터의 제1 예측 이득 및 상기 제2채널의 상기 블록의 예측으로부터의 제2 예측 이득을 계산하거나, 또는 상기 제1채널에 대한 제1 예측 필터의 제1 반사계수 및 상기 제2채널에 대한 제2 예측 필터의 제2 반사계수를 계산하고, 상기 제1 예측 이득 및 상기 제2 예측 이득을 이용하거나 상기 제1 반사계수 및 상기 제2 반사계수를 이용하여 유사성을 얻도록(12c) 형성되는, 유사성을 결정하는 수단(12)과;
    예측 필터링을 수행하는 수단(16)으로서, 만약 유사성이 쓰레쉬홀드 유사성 보다 크면 상기 예측 필터링을 수행하기 위해, 상기 제1 채널의 상기 스펙트럼 값 블록 및 상기 제2 채널의 상기 스펙트럼 값 블록에 대해 공동 예측 필터를 이용하고, 만약 상기 유사성이 쓰레쉬홀드 유사성 보다 작다면, 상기 예측 필터링을 수행하기 위해 2개의 다른 예측 필터를 이용하도록 형성되는, 예측 필터링을 수행하는 수단(16)을 포함하는 멀티채널 신호를 처리하는 장치.
  2. 제 1항에 있어서,
    상기 예측 필터링을 수행하는 수단(16)은 상기 예측의 결과로서 스펙트럼 잔류 값을 출력하도록 형성되고,
    상기 멀티채널 신호를 처리하는 장치는: 만약 상기 유사성이 쓰레쉬홀드 유사성보다 크다면, 스펙트럼 잔류 값 또는 상기 스펙트럼 잔류 값으로부터 유래된 제1 채널의 값, 그리고 스펙트럼 잔류 값 또는 상기 스펙트럼 잔류 값으로부터 유래된 제2 채널의 값을 공동으로 코딩하는 수단(20)을 더 포함하는, 멀티채널 신호를 처리하는 장치.
  3. 제 2항에 있어서,
    상기 공동 코딩은 미드/사이드 코딩인, 멀티채널 신호를 처리하는 장치.
  4. 제 3항에 있어서,
    상기 공동 코딩 수단(20)은, 상기 제1 및 제2 채널의 합에 근거하여 미드 신호를 계산하고, 제1 및 제2 채널의 차에 근거하여 사이드 신호를 계산하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  5. 제 1항에 있어서,
    채널에 대한 상기 스펙트럼 값 블록은 그 채널의 숏타임(shot-time) 스펙트럼을 나타내거나, 상기 스펙트럼 값 블록은 다수개의 서브밴드에 대한 다수개의 밴드패스 신호를 포함하는, 멀티채널 신호를 처리하는 장치.
  6. 제 1항에 있어서,
    상기 예측 필터링을 수행하는 수단(16)은 TNS 프로세싱을 수행하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  7. 제 1항에 있어서,
    상기 유사성을 결정하는 수단(12)은 상기 제1 및 제2 채널의 교차 상관을 계산하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  8. 제 1항에 있어서,
    상기 예측 필터링을 수행하는 수단(16)은, 상기 제1 예측 이득과 상기 제2 예측 이득이 3퍼센트 보다 작거나 그와 같을 때 하나의 예측 필터를 이용하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  9. 제 1항에 있어서,
    상기 예측 필터링을 수행하는 수단(16)은, 상기 공동 예측 필터로서, 계수가 상기 다른 스펙트럼 값 블록 보다 큰 에너지를 포함하는 상기 스펙트럼 값 블록으로부터 유래된 예측 필터를 이용하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  10. 제 1항에 있어서,
    상기 예측 필터링을 수행하는 수단(16)은, 파코 계수 또는 반사 계수와, 예측 이득을 얻고 상기 파코 계수로 상기 스펙트럼 값 블록을 필터링하여 스펙트럼 잔류 값을 얻기 위해서, 상기 주파수 전체에 걸친 예측을 위한 자기 상관 계산 및 LPC 계산을 레빈슨-더빈 알고리즘을 이용하여 상기 스펙트럼 값 블록에 수행하도록 형성되는, 멀티채널 신호를 처리하는 장치.
  11. 멀티채널 신호를 처리하는 방법으로서, 상기 멀티채널 신호는 적어도 2개 채널 각각에 대한 스펙트럼 값의 블록에 의해 나타내는, 멀티채널 신호를 처리하는 방법에 있어서,
    상기 2개의 채널 중의 하나인 제1채널과 상기 2개의 채널 중의 하나인 제2채널 사이의 유사성을 결정하는 단계(12)로서, 상기 제1채널의 상기 블록의 예측으로부터의 제1 예측 이득 및 상기 제2채널의 상기 블록의 예측으로부터의 제2 예측 이득을 계산함으로써, 상기 제1 예측 이득 및 상기 제2 예측 이득으로부터 상기 유사성을 얻거나(12c), 상기 제1채널에 대한 제1 예측 필터의 제1 반사계수 및 상기 제2채널에 대한 제2 예측 필터의 제2 반사계수를 계산함으로써, 상기 제1 반사계수 및 상기 제2 반사계수를 이용하여 유사성을 얻게 되는, 유사성을 결정하는 단계(12);
    만약 유사성이 쓰레쉬홀드 유사성 보다 크면, 상기 제1 채널의 상기 스펙트럼 값 블록 및 상기 제2 채널의 상기 스펙트럼 값 블록에 대해 공동 예측 필터를 이용하여 예측 필터링을 수행하는 단계, 또는,
    만약 상기 유사성이 쓰레쉬홀드 유사성 보다 작다면, 상기 제1 채널의 상기 스펙트럼 값 블록 및 상기 제2 채널의 상기 스펙트럼 값 블록에 대해 2개의 다른 예측 필터를 이용하여 예측 필터링을 수행하는 단계를 포함하는 멀티채널 신호를 처리하는 방법.
  12. 컴퓨터에서 실행될 때, 상기 청구항 11의 멀티채널 신호를 처리하는 방법을 수행하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
KR1020067016991A 2004-03-01 2005-02-28 멀티채널 신호를 처리하는 장치 및 방법 KR100823097B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004009954.5 2004-03-01
DE102004009954A DE102004009954B4 (de) 2004-03-01 2004-03-01 Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals

Publications (2)

Publication Number Publication Date
KR20060121982A KR20060121982A (ko) 2006-11-29
KR100823097B1 true KR100823097B1 (ko) 2008-04-18

Family

ID=34894904

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067016991A KR100823097B1 (ko) 2004-03-01 2005-02-28 멀티채널 신호를 처리하는 장치 및 방법

Country Status (18)

Country Link
US (1) US7340391B2 (ko)
EP (1) EP1697930B1 (ko)
JP (1) JP4413257B2 (ko)
KR (1) KR100823097B1 (ko)
CN (1) CN1926608B (ko)
AT (1) ATE364882T1 (ko)
AU (1) AU2005217517B2 (ko)
BR (1) BRPI0507207B1 (ko)
CA (1) CA2558161C (ko)
DE (2) DE102004009954B4 (ko)
DK (1) DK1697930T3 (ko)
ES (1) ES2286798T3 (ko)
HK (1) HK1095194A1 (ko)
IL (1) IL177213A (ko)
NO (1) NO339114B1 (ko)
PT (1) PT1697930E (ko)
RU (1) RU2332727C2 (ko)
WO (1) WO2005083678A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
KR100718416B1 (ko) 2006-06-28 2007-05-14 주식회사 대우일렉트로닉스 예측필터를 이용한 채널간 스테레오 오디오 코딩 방법
JP4940888B2 (ja) * 2006-10-23 2012-05-30 ソニー株式会社 オーディオ信号伸張圧縮装置及び方法
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
JPWO2008090970A1 (ja) * 2007-01-26 2010-05-20 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
US8086465B2 (en) 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
ATE547786T1 (de) * 2007-03-30 2012-03-15 Panasonic Corp Codierungseinrichtung und codierungsverfahren
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
WO2009122757A1 (ja) * 2008-04-04 2009-10-08 パナソニック株式会社 ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
EP3779977B1 (en) * 2010-04-13 2023-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder for processing stereo audio using a variable prediction direction
US8891775B2 (en) * 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
EP3699909A1 (en) * 2015-09-25 2020-08-26 VoiceAge Corporation Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel
CN107659888A (zh) * 2017-08-21 2018-02-02 广州酷狗计算机科技有限公司 识别伪立体声音频的方法、装置及存储介质
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
CN108962268B (zh) * 2018-07-26 2020-11-03 广州酷狗计算机科技有限公司 确定单声道的音频的方法和装置
CN112151045A (zh) 2019-06-29 2020-12-29 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
CN112053669B (zh) * 2020-08-27 2023-10-27 海信视像科技股份有限公司 一种人声消除方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999022451A2 (de) * 1997-10-24 1999-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms
KR20010096676A (ko) * 2001-07-05 2001-11-08 김풍민 멀티채널 스피커용 오디오 신호를 멀티 채널 헤드폰용오디오 신호로 변환하여 재분배 하는 방법 및 그 장치
KR100351219B1 (ko) * 1993-11-23 2003-01-24 에이티 앤드 티 코포레이션 오디오신호의인지코딩방법및장치
JP2007009804A (ja) * 2005-06-30 2007-01-18 Tohoku Electric Power Co Inc 風力発電施設の出力電力制御スケジュールシステム
JP2007095002A (ja) * 2005-09-30 2007-04-12 Noritsu Koki Co Ltd 写真処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5913187A (en) * 1997-08-29 1999-06-15 Nortel Networks Corporation Nonlinear filter for noise suppression in linear prediction speech processing devices
DE19829284C2 (de) * 1998-05-15 2000-03-16 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
US6771723B1 (en) * 2000-07-14 2004-08-03 Dennis W. Davis Normalized parametric adaptive matched filter receiver
US6622117B2 (en) * 2001-05-14 2003-09-16 International Business Machines Corporation EM algorithm for convolutive independent component analysis (CICA)
GB0124352D0 (en) * 2001-10-11 2001-11-28 1 Ltd Signal processing device for acoustic transducer array
ES2341327T3 (es) * 2002-04-10 2010-06-18 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de señales audio multicanal.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100351219B1 (ko) * 1993-11-23 2003-01-24 에이티 앤드 티 코포레이션 오디오신호의인지코딩방법및장치
WO1999022451A2 (de) * 1997-10-24 1999-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms
KR20010096676A (ko) * 2001-07-05 2001-11-08 김풍민 멀티채널 스피커용 오디오 신호를 멀티 채널 헤드폰용오디오 신호로 변환하여 재분배 하는 방법 및 그 장치
JP2007009804A (ja) * 2005-06-30 2007-01-18 Tohoku Electric Power Co Inc 風力発電施設の出力電力制御スケジュールシステム
JP2007095002A (ja) * 2005-09-30 2007-04-12 Noritsu Koki Co Ltd 写真処理装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
10-0351219
10-2001-0096676
특1995-0024454
특1998-046584

Also Published As

Publication number Publication date
RU2332727C2 (ru) 2008-08-27
AU2005217517B2 (en) 2008-06-26
DE502005000864D1 (de) 2007-07-26
CA2558161C (en) 2010-05-11
CN1926608B (zh) 2010-05-05
JP4413257B2 (ja) 2010-02-10
DK1697930T3 (da) 2007-10-08
HK1095194A1 (en) 2007-04-27
AU2005217517A1 (en) 2005-09-09
WO2005083678A1 (de) 2005-09-09
ATE364882T1 (de) 2007-07-15
EP1697930B1 (de) 2007-06-13
JP2007525718A (ja) 2007-09-06
NO339114B1 (no) 2016-11-14
US7340391B2 (en) 2008-03-04
NO20064431L (no) 2006-09-29
IL177213A0 (en) 2006-12-10
ES2286798T3 (es) 2007-12-01
DE102004009954A1 (de) 2005-09-29
DE102004009954B4 (de) 2005-12-15
CN1926608A (zh) 2007-03-07
EP1697930A1 (de) 2006-09-06
BRPI0507207B1 (pt) 2018-12-26
US20070033056A1 (en) 2007-02-08
RU2006134641A (ru) 2008-04-10
BRPI0507207A (pt) 2007-06-12
PT1697930E (pt) 2007-09-25
CA2558161A1 (en) 2005-09-09
BRPI0507207A8 (pt) 2018-06-12
IL177213A (en) 2011-10-31
KR20060121982A (ko) 2006-11-29

Similar Documents

Publication Publication Date Title
KR100823097B1 (ko) 멀티채널 신호를 처리하는 장치 및 방법
US8255211B2 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
EP3417544B1 (en) Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
JP3592473B2 (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
KR100852482B1 (ko) 추정을 결정하는 방법 및 장치
KR102248008B1 (ko) 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법
AU2005217508B2 (en) Device and method for determining a quantiser step size
US20100274557A1 (en) Method and an apparatus for processing a signal
KR20170104661A (ko) 오디오 신호 디코딩 또는 인코딩을 위한 시간 도메인 레벨 조정
JP4685165B2 (ja) 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
US11043226B2 (en) Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
US10186273B2 (en) Method and apparatus for encoding/decoding an audio signal
CN115843378A (zh) 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法
MXPA06009933A (en) Device and method for processing a multi-channel signal
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
JP2005165056A (ja) オーディオ信号符号化装置及び方法
MXPA06009932A (en) Device and method for determining a quantiser step size

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130405

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140401

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170404

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180403

Year of fee payment: 11