KR101108061B1 - 신호 처리 방법 및 이의 장치 - Google Patents

신호 처리 방법 및 이의 장치 Download PDF

Info

Publication number
KR101108061B1
KR101108061B1 KR1020090090518A KR20090090518A KR101108061B1 KR 101108061 B1 KR101108061 B1 KR 101108061B1 KR 1020090090518 A KR1020090090518 A KR 1020090090518A KR 20090090518 A KR20090090518 A KR 20090090518A KR 101108061 B1 KR101108061 B1 KR 101108061B1
Authority
KR
South Korea
Prior art keywords
phase difference
inter
channel
difference value
signal
Prior art date
Application number
KR1020090090518A
Other languages
English (en)
Other versions
KR20100035122A (ko
Inventor
이현국
윤성용
김동수
임재현
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to PCT/KR2009/005497 priority Critical patent/WO2010036059A2/en
Priority to JP2011528941A priority patent/JP5426680B2/ja
Priority to EP09012229.2A priority patent/EP2169666B1/en
Priority to CN200980137978XA priority patent/CN102165520B/zh
Priority to US12/567,355 priority patent/US8346379B2/en
Priority to ES09012229.2T priority patent/ES2547232T3/es
Publication of KR20100035122A publication Critical patent/KR20100035122A/ko
Application granted granted Critical
Publication of KR101108061B1 publication Critical patent/KR101108061B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 복수채널 신호로부터 생성된 다운믹스 신호 및 상기 다운믹스 신호를 업믹싱하기 위하여 상기 복수채널 신호의 속성을 나타내는 공간정보를 수신하는 단계; 상기 공간정보의 헤더로부터 채널간 위상차이 값이 상기 공간정보에서 이용되는지 여부를 나타내는 채널간 위상차이 코딩 플래그를 획득하는 단계; 상기 채널간 위상차이 코딩 플래그에 기초하여, 상기 프레임으로부터 상기 채널간 위상차이 값이 상기 프레임에서 이용되는지 여부를 나타내는 채널간 위상차이 모드 플래그를 획득하는 단계; 상기 채널간 위상차이 모드 플래그에 기초하여, 프레임의 파라미터 타임 슬롯의 파라미터 밴드별로 상기 채널간 위상차이 값을 획득하는 단계; 이전 파라미터 타임 슬롯의 채널간 위상차이 값을 이용하여 상기 채널간 위상차이 값을 수정함으로써 상기 채널간 위상차이 값을 스무딩하는 단계; 상기 다운믹스 신호에 상기 스무딩된 채널간 위상차이 값을 적용하여 복수채널 신호로 업믹싱하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법 및 이의 장치를 개시한다.
채널간 위상차이 값, 채널간 위상차이 코딩 플래그, 채널간 위상차이 모드 플래그, 위상이동 플래그

Description

신호 처리 방법 및 이의 장치{A METHOD AND AN APPARATUS FOR PROCESSING A SIGNAL}
본 발명은 입력된 신호의 위상을 이동시킨 신호를 이용하고, 상기 위상의 이동된 신호의 채널간 위상차이 값을 이용함으로써 신호의 음질을 향상시키고, 입력된 신호를 보다 완벽하게 복원하기 위한 신호 처리 방법 및 장치에 관한 것이다.
일반적으로, 모노 신호로부터 스테레오 신호를 생성하기 위하여 디코릴레이터(decorrelator)를 이용하여 신호를 코딩할 수 있다.
또한, 신호 처리 장치에서 채널간 레벨차이 값 및 채널간 상관값을 이용하여 신호를 코딩할 수 있다.
음성 신호를 디코릴레이터(decorrelator)를 이용하여 생성하는 경우, 디코릴레이터는 채널 신호들 사이에 존재하는 위상 차이 또는 딜레이 차이를 정확하게 재생하지 못하는 문제점이 있다.
또한, 채널간 레벨차이 값 및 채널간 상관값을 이용하여 신호를 코딩하는 경우, 입력 신호가 가지고 있는 채널간 위상차이를 복원하여 반영할 수 없어 정확한 음상의 정위(localization)를 수행하기 어렵고, 입력 신호의 공간감을 복원할 수 없는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 디코딩된 오디오 신호 또는 음성 신호의 위상을 채널간 위상차이 값 및 위상이동 플래그를 이용하여 복원 및 이동함으로써, 음질이 향상되고 원음에 가까운 신호의 처리 방법 및 장치를 제공하는데 그 목적이 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 본 발명의 신호 처리 방법 및 장치는, 위상이동 플래그에 기초하여 디코딩된 오디오 신호 또는 음성 신호의 위상을 이동시켜 디코딩시 디코릴레이터에 의하여 효율적으로 재생하기 어려운 위상 차이 또는 딜레이 차이를 효율적으로 재생할 수 있는 효과를 갖는다.
둘째, 본 발명의 신호 처리 방법 및 장치는, 채널간 위상차이 코딩 플래그 및 채널간 위상차이 모드 플래그에 기초하여, 채널간 위상차이 값을 이용함으로써, 채널간 레벨차이 값 및 채널간 상관값으로 복원이 힘든 공간감을 복원하고, 음상의 정위(localization)을 명확하게 할 수 있다.
셋째, 본 발명의 신호 처리 방법 및 장치는, 각 프레임마다 채널간 위상차이 값을 이용하는지 여부를 나타내는 채널간 위상차이 모드 플래그를 수신함으로써, 필요에 따라 채널간 위상차이 값을 이용하여 신호를 디코딩할 수 있다.
넷째, 본 발명의 신호 처리 방법 및 장치는, 이전 파라미터 타임 슬롯의 채널간 위상차이 값을 이용하여 현재 파라미터 타임 슬롯의 채널간 위상차이 값을 수정함(smoothing)으로써, 채널간 위상차이 값의 차이에 의하여 일시적으로(transient) 발생할 수 있는 잡음(noise)를 제거할 수 있는 효과를 갖는다.
다섯째, 본 발명의 신호 처리 방법 및 장치는, 일정 조건을 만족시키는 경우에만 채널간 위상차이 값을 전송함으로써 코딩 효율을 높이고, 원음에 가까운 신호를 디코딩할 수 있다.
여섯째, 본 발명의 신호 처리 방법 및 장치는, 인코더에서 측정된 채널간 위상차이 값을 채널간 레벨차이 값으로 변환하여 전송함으로써, 채널간 위상차이 값의 전송을 허용하지 아니하는 기존의 신호 처리 장치 및 방법을 이용하는 경우에도 공간감이 향상되고 음상의 정위(localization)가 원음에 가까운 신호를 복원할 수 있는 효과가 있다(Backward compatibility).
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 발명에서 코딩이라 함은, 인코딩 및 디코딩을 모두 포함하는 개념으로 이해되어야 한다.
또한, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다. 그리고, 본 명세서에서 신호의 일 예로 스테레오 신호를 설명하나, 이에 한정되지 아니하고, 3 개 이상의 복수 개의 채널을 갖는 복수채널 신호일 수 있다.
도 1은 본 발명의 일실시예에 따른 신호 처리 방법의 개념을 나타내는 개념도로, 공간정보의 비트스트림을 나타낸다. 도 1을 참조하면, 공간정보(spatial information)는 헤더 및 복수개의 프레임으로 구획될 수 있다. 여기서 공간정보는 입력 신호인 복수채널 신호의 속성을 나타내는 정보이고, 복수채널 중 두 채널 사이의 레벨 차이를 나타내는 채널간 레벨차이 값, 두 채널 사이의 상관도를 나타내는 채널간 상관값 및 두 채널 사이의 위상 차이를 나타내는 채널간 위상차이 값을 포함할 수 있다. 이는 디코더에서 복수채널 신호를 다운믹싱하여 생성된 다운믹스 신호를 업믹싱하여 복원하기 위해 이용될 수 있다.
공간정보의 헤더는 전체 프레임에서 채널간 위상차이 값이 이용되는 프레임이 있는지 여부를 나타내는 채널간 위상차이 코딩 플래그(bsPhaseCoding)를 포함한다. 즉, 채널간 위상차이 코딩 플래그는 헤더에 포함됨으로써 공간정보의 모든 프레임에서 채널간 위상차이 값이 이용되는지 여부를 판단할 수 있는 것이다. 채널간 위상차이 코딩 플래그의 의미는 하기 표 1과 같다.
bsPhaseCoding 의미
1 공간정보에 IPD 코딩이 적용됨을 나타냄
즉, 전체 프레임 중 적어도 하나 이상의 프레임에서 IPD 값이 이용됨을 나타냄
0 공간정보에 IPD 코딩이 적용되지 아니함을 나타냄
즉, 전체 프레임에서 IPD 값이 이용되지 아니함을 나타냄
또한, 공간정보는 프레임에서 채널간 위상차이 값이 이용되는지 여부를 나타내는 채널간 위상차이 모드 플래그(bsPhaseMode)를 각 프레임마다 포함한다. 채널간 위상차이 모드 플래그는 채널간 위상차이 코딩 플래그가 1인 경우, 즉 채널간 위상차이 코딩 플래그가 공간정보에 IPD 코딩이 이용됨을 나타내는 경우에만 프레임에 포함된다. 채널간 위상차이 모드 플래그(bsPhaseMode)의 구체적인 의미는 하기 표 2와 같다.
bsPhaseMode 의미
1 현재 프레임에서 IPD 값이 이용됨을 나타냄
0 현재 프레임에서 IPD 값이 이용되지 아니함을 나타냄
다시 도 1을 참조하면, 프레임 2(Frame 2)의 채널간 위상차이 모드 플래그가 1이면(bsPhaseMode=1), 프레임 2에 채널간 위상차이 값(IPD)가 0이 아닌 값(value)로 포함되고, 프레임 3(Frame 3)의 채널간 위상차이 모드 플래그가 0이면(bsPhaseMode=0), 프레임 3에 채널간 위상차이 값(IPD)는 0의 값을 갖는다.
따라서, 채널간 위상차이 코딩 플래그 및 채널간 위상차이 모드 플래그에 기초하여 채널간 위상차이 값을 획득하고, 이를 다운믹스 신호에 적용하여 복수채널 신호로 업믹싱할 수 있다.
도 2는 본 발명의 일실시예에 따른 신호 처리 장치를 나타내는 블록도이다. 도 2를 참조하면, 신호 처리 장치(200)는 다운믹싱부(210), 공간정보 생성부(220), 멀티플렉싱부(230), 디멀티플렉싱부(240), 정보획득부(250) 및 업믹싱부(260)를 포함한다.
다운믹싱부(210)는 상기 복수채널 신호를 입력받아 다운믹스 신호(DMX)를 생성할 수 있다. 상기 복수채널 신호는 3 개 이상의 채널을 갖는 신호일 수 있으나, 모노 또는 스테레오 채널을 갖는 신호일 수도 있다. 다운믹싱부(210)는 상기 복수채널 신호를 다운믹싱(downmixing)함으로써 상기 복수채널 신호의 채널수보다 작은 수의 채널을 갖는 다운믹스 신호를 생성할 수 있다.
공간정보 생성부(220)는 도 1을 참조하여 상술한 바와 같이, 상기 다운믹스 신호를 추후 디코더에서 업믹싱하기 위한 공간정보(spatial information)정보를 생성하며, 상기 공간정보는 복수채널 신호의 속성을 나타낼 수 있다. 상기 공간정보는 상술한 바와 같이 채널간 레벨차이 값, 채널간 상관값 및 채널간 위상차이 값 등을 포함할 수 있으나, 여기서는 도 2의 공간정보 생성부(220)를 참조하여 채널간 위상차이 값에 대하여 구체적으로 설명하기로 한다.
공간정보 생성부(220)는 IPD 이용결정부(221), IPD 값 측정부(222), IPD 코드 플래그 생성부(223) 및 IPD 코딩 플래그 생성부(224)를 포함한다. IPD 이용결정부(221)는 상기 공간정보에 채널간 위상차이(IPD) 값을 포함시킬지 여부를 결정할 수 있으며, 상세하게는, 복수채널 신호의 특성, 채널간 위상차이 값과 채널간 레벨차이 값의 비율에 기초하여 채널간 위상차이 값의 포함여부를 결정할 수 있다. 예를 들어, 복수채널 신호가 음성 신호인 경우, 채널간 위상차이 값을 공간정보에 포함시키도록 결정할 수 있는데, 이는 추후에 상세하게 설명하기로 한다.
IPD 값 측정부(222)는 IPD 이용결정부(221)에서 채널간 위상차이 값을 이용하기로 결정한 경우, 공간정보 생성부(200)에 입력된 복수채널 신호로부터 두 채널사이의 위상차이를 측정한다. 상기 측정된 위상차이는 위상(phase) 및/또는 각도(angle)일 수 있고, 시간 차이(time difference)일 수 있으며, 각도 또는 시간차이에 대응하는 인덱스값일 수도 있다. 신호(signal)에서 위상과 시간 차이는 밀접한 관계를 갖는데, 이와 관련된 상세한 설명은 도 3를 참고하여 후술하기로 한다.
IPD 모드 플래그 생성부(223)는 도 1을 참조하여 상술한 채널간 위상차이 모드 플래그(bsPhaseMode)를 생성한다. 즉, 채널간 위상차이 값이 프레임에서 이용되는지 여부를 나타내며, 상기 프레임은 상기 채널간 위상차이 값이 포함된 현재 프레임(current frame)일 수 있다. 따라서, 채널간 위상차이 모드 플래그는 프레임별로 가변적으로 존재할 수 있다. 상세하게는 채널간 위상차이 코딩 플래그가 채널간 위상차이 값이 공간정보의 모든 프레임에서 이용되지 아니하였음을 나타내는 경우에는, 프레임에 채널간 위상차이 모드 플래그가 포함되지 않을 수 있다. 그리고, 채널간 위상차이 모드 플래그가 0 또는 1의 값을 가질 수 있다.
IPD 코딩 플래그 생성부(224)는 도 1을 참조하여 상술한 채널간 위상차이 코딩 플래그(bsPhaseCoding)를 생성한다. 즉, IPD 코딩이 공간정보에서 이용되는지를 나타내는 IPD 코딩 플래그가 생성하기 때문에, 도 1을 참조하여 구획된 공간정보의 적어도 하나 이상의 프레임에서 채널간 위상차이 값을 이용하는 경우, 채널간 위상차이 코딩 플래그가 1을 나타내는 것이 당연하다.
정보 획득부(230)는 공간정보 생성부(220)로부터 공간정보를 입력받는다. 상기 공간정보에는 채널간 위상차이(IPD) 값뿐만 아니라, 채널간 위상차이 코딩 플래그(bsPhaseCoding) 및 채널간 위상차이 모드 플래그(bsPhaseMode)가 포함될 수 있다. 정보 획득부(230)는 IPD 코딩 플래그 획득부(231), IPD 모드 플래그 획득부(232) 및 IPD 값 획득부(233)를 포함하는데, IPD 코딩 플래그 획득부(231)는 공간정보의 헤더로부터 공간정보의 전체 프레임 중 적어도 하나 이상의 프레임에서 채널간 위상차이 값이 이용되는지 여부를 나타내는 채널간 위상차이 코딩 플래그를 획득한다. 상기 채널간 위상차이 코딩 플래그의 의미는 상기 표 1과 같다.
IPD 모드 플래그 획득부(232)는 채널간 위상차이 코딩 플래그에 기초하여, 공간정보의 프레임으로부터 채널간 위상차이 값이 프레임에서 이용되는지 여부를 나타내는 채널간 위상차이 모드 플래그(bsPhaseMode)를 획득한다. 상세하게는, 채널간 위상차이 코딩 플래그가 채널간 위상차이 값이 이용됨을 나타내는 경우(bsPhaseCoding=1)에 IPD 모드 플래그 획득부(232)는 채널간 위상차이 모드 플래그를 획득할 수 있다.
IPD 값 획득부(233)는 채널간 위상차이 모드 플래그에 기초하여, 공간정보로부터 채널간 위상차이 값을 획득할 수 있다. 상기 채널간 위상차이 값은 파라미터 밴드별로 존재할 수 있다. 본 명세서에서 파라미터 밴드란 동일한 채널간 위상차이 값이 포함되는 적어도 하나 이상의 서브밴드를 나타내는데, 이는 추후 도 7 및 도 8을 참고하여 후술하기로 한다.
업믹싱부(240)는 정보 획득부(230)로부터 획득된 채널간 위상차이 값을 다운믹싱부(210)로부터 입력된 다운믹스 신호에 적용하여 복수채널 신호를 생성할 수 있다. 상기 업믹싱(upmixing)이라 함은, 상기 다운믹스 신호의 채널보다 많은 수의 채널 신호를 생성하기 위하여 업믹싱 매트릭스를 적용하는 것을 지칭하고, 업믹싱된 신호라 함은 상기 업믹싱 매트릭스가 적용된 신호를 지칭한다. 따라서, 상기 복수 채널 신호는 상기 다운믹스 신호보다 많은 수의 채널을 갖는 신호이다. 또한, 상기 업믹싱 매트릭스가 적용된 신호 자체를 지칭할 수 있고, 상기 업믹싱 매트릭스가 적용됨으로써 복수개의 채널을 갖도록 생성된 QMF 도메인 신호일 수도 있으며, 상기 QMF 도메인 신호가 시간 도메인 상의 신호로 변환된 최종 신호일 수도 있다.
이와 같이, 본 발명의 신호 처리 장치 및 방법은, 채널간 위상차이 코딩 플래그 및 채널간 위상차이 모드 플래그에 기초하여, 채널간 위상차이 값을 이용함으로써, 채널간 레벨차이 값 및 채널간 상관값으로 복원이 힘든 공간감을 복원하고, 음상의 정위(localization)을 명확하게 할 수 있는 효과를 갖는다.
도 3은 신호(signal)에서 위상(phase)와 시간(time)과의 관계를 나타내는 그래프이다. 도 3의 왼쪽 그래프는 신호를 위상-진폭 도메인상에 나타낸 것이다. (a) 신호는 위상 변화없이 입력된 신호이고, (b) 신호는 (a) 신호보다 π/2 만큼 위상이 늦어진 신호를 나타낸다.
한편, 도 3의 오른쪽 그래프는 신호를 시간-진폭 도메인상에 나타낸 것으로, 왼쪽 그래프의 (a) 및 (b) 신호에 대응하는 (a)' 및 (b)' 신호를 나타낸다. 즉, (a) 신호보다 π/2만큼 위상이 늦어진 신호인 (b) 신호는 시간으로는 (a)'신호보다 3.3ms 늦게 입력된 신호인 (b)'신호와 동일하게 나타낼 수 있다. 이와 같이, 신호에서 위상-시간은 밀접한 관계를 나타내며, 이들은 서로 대응하는 값으로 변환하여 이용하는 경우에도 동일한 효과를 갖는다.
도 4는 도 2의 IPD 값 측정부 및 IPD 값 획득부를 구체적으로 나타내는 블록도이다. IPD 값 측정부(410)는 IPD 값 측정부(411), IPD 양자화부(412) 및 양자화 모드 플래그 생성부(413)를 포함한다. IPD 값 측정부(411)는 입력된 복수채널 신호로부터 채널간 위상차이 정보를 측정한다. 상술한 바와 같이, 채널간 위상차이 값은 위상각일 수 있고, 시간 지연값일 수 있으며, 이들과 대응하는 인덱스 값일 수도 있다.
IPD 양자화부(412)는 IPD 값 측정부(411)에서 측정된 채널간 위상차이 값을 양자화한다. IPD 양자화부(412)는 양자화 간격에 따라 채널간 위상차이 값을 각각 다른 방법으로 양자화(quantization)할 수 있는 세부구조를 더 포함할 수 있다. 예를 들어, 제 1 양자화부(미도시)에서는 미세한 양자화 간격(미세 간격)을 이용하여 채널간 위상차이 값을 양자화할 수 있고, 제 2 양자화부(미도시)에서는 성긴 양자화 간격(성긴 간격)을 이용하여 채널간 위상차이 값을 양자화할 수 있다.
또한, 양자화 모드 플래그 생성부(413)는 채널간 위상차이 값을 양자화하는 방식을 나타내는 양자화 모드 플래그(quant_mode_flag)를 생성할 수 있다. 양자화 모드 플래그는, 상세하게는, 미세 간격 또는 성긴 간격을 이용하여 채널간 위상차이 값을 양자화하는지 여부를 나타낼 수 있다.
채널간 위상차이 값 획득부(IPD 값 획득부,420)는 양자화 모드 플래그 획득부(421), 제 1 역양자화부(422), 제 2 역양자화부(423) 및 역양자화된 IPD 값 획득부(424)를 포함한다.
먼저, 양자화 모드 플래그 획득부(421)는 인코더로부터 수신된 공간정보로부터 채널간 위상차이 값에 적용된 양자화 방식을 나타내는 양자화 모드 플래그(quant_mode_flag)를 획득한다. 상기 양자화 모드 플래그의 의미는 하기 표 3과 같다.
quant_mode_flag 의미
1 채널간 위상차이 값을 미세 간격을 이용하여 양자화함을 나타냄
0 채널간 위상차이 값을 성긴 간격을 이용하여 양자화함을 나타냄
제 1 역양자화부(422)는 양자화 플래그가 0인 경우(IPD_quant_flag=0) 채널간 위상차이 값을 수신받아 성긴 간격을 이용하여 채널간 위상차이 값을 역양자화한다. 반면, 제 2 역양자화부(423)는 양자화 플래그가 1인 경우(IPD_quant_flag=1) 채널간 위상차이 값을 수신받아 미세 간격을 이용하여 채널간 위상차이 값을 역양자화한다. 이후, 역양자화된 IPD 값 획득부(424)는 제 1 역양자화부(422) 또는 제 2 역양자화부(423)로부터 역양자화된 채널간 위상차이 값을 획득할 수 있다.
도 5는 위상이동 플래그를 이용하여 복수채널 신호의 위상복원을 보완하는 신호 처리 장치(500)를 나타내는 것이다. 신호 처리 장치(500)는 글로벌-밴드 IPD 값 결정부(510), 신호 수정부(520), 다운믹싱부(530), 공간정보 생성부(540), 공간정보 획득부(550), 업믹싱부(560) 및 위상 이동부(570)를 포함한다.
글로벌-밴드 IPD 값 결정부(510)는 먼저 복수채널 신호를 입력받는다. 복수채널 신호는 하나 이상의 채널의 위상이 불일치한 신호일 수 있고, 스테레오 신호일 수 있으나, 3개 이상의 채널을 갖는 신호일 수 있다. 글로벌-밴드 IPD 값 결정부(510)는 입력된 복수채널 신호의 위상을 일치시키기 위하여 이동될 위상의 정도를 나타내는 위상이동 플래그를 복수채널 신호로부터 결정한다.
상기 위상이동 플래그는 상기 복수채널 신호의 위상이 이동되었다는 것을 나타내는 플래그 정보일 수 있고, 상기 플래그 정보뿐만 아니라 위상이 이동된 정보, 위상이 이동되는 채널신호, 위상이동이 일어나는 주파수 대역, 및 위상이동과 대응하는 시간 정보 등의 위상이동과 관련된 정보를 더 포함할 수도 있다.
먼저, 위상이동 플래그가 플래그 정보만을 나타내는 경우, 복수채널 신호는 고정된 값을 이용하여 위상이 이동될 수 있다. 예를 들어, 복수채널 신호가 스테레오 신호인 경우, 스테레오 신호 중 우측 채널의 위상을
Figure 112009058766702-pat00001
만큼 감소시키거나 좌측 채널의 위상을
Figure 112009058766702-pat00002
만큼 증가시킴으로써 좌측 및 우측 채널이 직교하도록 위상을 이동시켜 상기 복수채널 신호를 생성할 수 있고,
Figure 112009058766702-pat00003
의 위상이동에 한정되지 아니하고 좌측 및 우측 채널이 직교하도록 위상을 이동시켜 상기 복수채널 신호를 생성할 수 있다.
이 때, 상기 이동하는 위상은 상기 복수채널 신호의 전체 주파수 밴드에 동일하게 적용될 수 있다. 또한, 상기 복수채널 신호의 하나 이상의 채널의 위상이
Figure 112009058766702-pat00004
만큼 변형된다는 정보, 상세하게는 변형되는 위상, 또는 직교하기 위하여 이동되는 위상에 관한 정보는 별도로 전송되지 아니하고, 추후 디코더단에서 기설정된 정보를 이용할 수 있으며, 이에 한정되지 아니한다.
이 경우, 복수개의 파라미터 밴드에 각각 채널간 위상차이 값을 전송하는 것에 비해 정보전송량을 감소시킬 수 있고, 파라미터 밴드마다 각각 채널간 위상차이 값을 적용하는 경우 발생할 수 있는 위상차이 문제를 방지할 수 있다.
한편, 상기 위상이동 플래그는 플래그 정보뿐만 아니라, 위상이동과 관련된 상세 정보를 더 포함할 수 있다. 상세정보는 위상의 이동정보, 위상이 이동되는 채널신호에 관한 정보, 위상이동이 일어나는 주파수 대역 및 시간 정보 등을 포함할 수 있다.
또한, 상기 위상이동 플래그는 프레임별로 복수채널 신호의 위상이 이동되는 정도를 가변적으로 나타낼 수 있고, 상기 위상이동 플래그가 플래그 정보만을 포함하는 경우에는 프레임별로 위상이 이동되었는지 여부를 나타낼 수 있다. 또한, 상기 위상이동 플래그가 플래그 정보 및 이동하는 위상에 관한 상세 정보를 포함하는 경우에는, 상기 상세 정보는 서브밴드 또는 파라미터 밴드별로 위상의 이동정도를 가변적으로 나타낼 수 있고, 일정한 시간 범위마다, 예를 들어, 프레임 또는 타임 슬롯 등, 가변적으로 해당 시간에서의 위상의 이동정도를 나타낼 수도 있다.
또한, 상기 위상이동 플래그는 도 1 내지 도 4를 참조하여 설명한 채널간 위상차이 값과 병렬적으로 이용될 수 있다.
신호수정부(520)는 상기 위상이동 플래그 및 상기 복수채널 신호를 입력받는다. 상기 복수채널 신호는 상기 위상이동 플래그를 이용하여 하나 이상의 채널의 위상을 수정함으로써 위상이 이동된 복수채널 신호를 생성할 수 있다. 상술한 바와 같이, 본 명세서에서는 위상이 불일치하는 복수채널 신호의 위상을 일치시키도록(in-phase) 복수채널 신호의 위상을 수정하고, 이와 관련된 위상이동 플래그를 생성하는 방법에 대하여 서술하였으나. 위상이 일치하는 복수채널 신호에 포함된 적어도 하나 이상의 채널의 위상을 고의적으로 이동시켜 위상이 불일치하는 신호(out-phase)로 만들고, 이와 관련된 위상이동 플래그를 생성하는 것도 가능하다.
다운믹싱부(530)는 상기 위상이 이동된 복수채널 신호를 입력받아 다운믹싱함으로써 다운믹스 신호를 생성한다. 상기 복수채널 신호는 스테레오 신호에 한정되지 아니하고, 3개 이상의 채널을 갖는 신호일 수 있다. 상기 복수채널 신호가 스테레오 신호인 경우 상기 다운믹스 신호는 모노 신호일 수 있고, 상기 복수채널 신호가 3 개 이상의 채널을 갖는 신호인 경우에 상기 다운믹스 신호는 스테레오 신호 또는 상기 복수채널 신호의 채널수보다 작은 수의 채널을 갖는 신호일 수 있다.
공간정보 생성부(540)는 상기 위상이 이동된 복수채널 신호를 입력받아 상기 복수채널 신호의 속성을 나타내는 공간정보를 생성할 수 있다. 상기 공간정보는 디코더에서 상기 다운믹스 신호를 상기 위상이 이동된 복수채널 신호로 업믹싱하기 위한 것으로, 채널간 레벨 차이 정보, 채널간 상관값 및 채널 예측 계수(Channel Prediction Coefficient)를 포함할 수 있다. 따라서, 본 발명의 공간정보 생성부(540)에서 생성된 공간정보는 위상이 이동되지 아니한 복수채널 신호로부터 생성된 공간정보와 동일하지 않을 수 있다.
또한, 비트스트림 생성부(미도시)는 상기 공간정보 및 상기 위상이동 플래그를 포함하는 하나의 비트스트림을 생성할 수 있고, 상기 다운믹스 신호, 상기 공간정보 및 상기 위상이동 플래그를 포함하는 하나의 비트스트림을 생성할 수도 있다.
정보 획득부(550)는 상기 비트스트림으로부터 다운믹스 신호를 업믹싱하기 위한 상기 공간정보 및 상기 위상이동 플래그를 획득한다.
업믹싱부(560)는 도 2의 업믹싱부(240)와 동일한 구성 및 기능을 수행한다. 업믹싱된 복수채널 신호는 업믹싱 매트릭스가 적용되어 업믹싱된 신호일 수 있고, 업믹싱되어 QMF 도메인상에 생성된 신호일 수 있으며, 시간 도메인 상의 신호로 최종 출력된 신호일 수도 있다. 또한, 업믹싱부(560)에서 업믹싱된 신호는 신호 수정부(520)에서 위상이 이동된 복수채널 신호일 수 있다.
위상 이동부(570)는 정보 획득부(550)로부터 위상이동 플래그 및 업믹싱부(560)로부터 위상이 이동된 복수채널 신호를 입력받는다. 이후, 상기 위상이 이동된 복수채널 신호에 상기 위상이동 플래그를 적용하여 복수채널 신호의 이동된 위상을 복원시킨다.
상기 위상이동 플래그는 상술한 바와 같이, 복수채널 신호의 적어도 하나 이상의 채널의 위상이 이동되었는지 여부를 나타내는 플래그 정보만을 포함할 수 있고, 위상이동과 관련된 상세 정보를 더 포함할 수도 있다. 플래그 정보만을 포함하는 경우, 위상 이동부(570)는 플래그 정보에 기초하여 업믹싱된 복수채널 신호의 위상을 이동시킬지 여부를 결정하고, 고정된 값을 이용하여 복수채널 신호의 적어도 하나 이상의 채널의 위상을 이동시킬 수 있다. 이 때, 고정된 값은 디코더에서 기설정된 값을 이용하고, 별도로 인코더에서 측정되어 전송되지 아니할 수 있으며, 예를 들면, 복수채널 신호의 하나 이상의 채널을
Figure 112009058766702-pat00005
만큼 증가시키거나 감소시킬 수 있다. 이 때, 상기
Figure 112009058766702-pat00006
는 복수채널 신호의 전체 주파수 밴드에 동일하게 적용될 수 있다. 또한, 상기 위상이동 플래그는 프레임별로 결정될 수 있으므로, 복수채널 신호의 위상이 이동되는 정도 또는 위상이 이동되었는지 여부를 프레임마다 가변적으로 나타낼 수 있다.
도 6은 위상이동 플래그를 이용하여 복수채널 신호의 위상복원을 보완하는 본 발명의 또다른 실시예를 나타내는 신호 처리 장치(600)를 나타내는 것이다. 도 6을 참조하면, 신호 처리 장치(600)는 다운믹싱부(610), 공간정보 생성부(620), 신호 수정부(630), 글로벌-밴드 IPD 값 획득부(640), 위상이동부(650) 및 업믹싱부(660)를 포함한다.
다운믹싱부(610)는 입력된 복수채널 신호를 다운믹싱하여 다운믹스 신호(DMX)를 생성한다. 이 때, 복수채널 신호는 위상이 이동되지 아니한 입력된 그대로의 신호이다.
공간정보 생성부(620)는 입력된 복수채널 신호의 속성을 나타내는 공간정보를 생성할 수 있다. 상기 공간정보는 도 5의 공간정보와 그 구성 및 기능을 동일하지만, 위상이 이동되지 아니한 복수채널 신호로부터 생성된다는 점에서 도 5의 공간정보와 상이하다. 한편, 공간정보 생성부(620)는 글로벌-밴드 IPD 값 결정부(621)를 포함하고, 글로벌-밴드 IPD 값 결정부(621)는 도 5의 글로벌-밴드 IPD 값 결정부와 그 구성과 기능이 동일하므로 상세한 설명을 생략하기로 한다.
신호 수정부(630)는 글로벌-밴드 IPD 값 결정부(621)로부터 출력된 위상이동 플래그에 기초하여 다운믹싱부(610)에서 출력된 다운믹스 신호의 적어도 하나 이상의 채널의 위상을 수정하여 위상이 수정된 다운믹스 신호(DMX')를 생성할 수 있다.
이후, 글로벌-밴드 IPD 값 획득부(640)는 위상이동 플래그를 획득하고, 위상 이동부(650)는 상기 위상이동 플래그에 기초하여 입력된 수정 다운믹스 신호(MDX )의 적어도 하나 이상의 채널의 위상을 이동시켜 복원함으로써, 다운믹스 신호(DMX)를 복원할 수 있다. 이 때, 위상 이동부(650)에서 위상이 이동된 다운믹스 신호(DMX)는 신호 수정부(630)에 입력되는 신호(DMX)와 동일할 수 있다.
업믹싱부(660)는 공간정보 생성부(620)로부터 공간정보 및 위상 이동부(650)로부터 다운믹스 신호(DMX)를 입력받아 복수채널 신호를 디코딩할 수 있다.
한편, 본 발명의 신호 처리 방법 및 장치는, 채널간 위상차이 값이 변동되는 지점에서 일시적으로(transient) 발생하는 잡음(noise)를 제거하기 위하여 여러가지 방법을 수행하는데, 이를 도 7 내지 도 9를 참고하여 후술하기로 한다.
먼저, 도 7은 파라미터 타임 슬롯을 나타내는 개념도이다. 신호(signal)는 시간-주파수 도메인으로 나타낼 수 있다. 도 7을 참조하면, 1개의 프레임의 N개의 타임슬롯 중 2개의 타임슬롯(타임슬롯 2, 타임슬롯 4)에 파라미터 세트가 적용된다. 그리고, 신호의 전체 주파수 범위는 5개의 파라미터 밴드(parameter band)로 분할된다. 따라서, 시간축의 단위는 타임 슬롯일 수 있고, 주파수 축의 단위는 파라미터 밴드(parameter band, pb)일 수 있으며, 상기 파라미터 밴드는 동일한 상기 채널간 위상차이 값이 포함되는 적어도 하나 이상의 주파수 도메인상의 서브밴드일 수 있다. 또한, 타임 슬롯 중 파라미터 세트가 적용되도록, 상세하게는 채널간 위상차이 값이 적용되도록 정의되어진 타임 슬롯을 파라미터 타임 슬롯(parameter time slot)이라고 지칭한다.
도 8은 본 발명의 또다른 실시예에 따라 채널간 위상차이 값을 수정(smoothing)하는 방법을 나타내는 개략도이다. 도 8을 참조하면, 왼쪽 하단의 그래프는 파라미터 타임 슬롯들 중 2번째 파라미터 밴드에 포함된 채널간 위상차이 값을 나타내는 그래프이다. 파라미터 타임 슬롯[0]에 적용되는 채널간 위상차이 값은 10 °일 수 있고, 파라미터 타임 슬롯[1]에 적용되는 채널간 위상차이 값은 60 °일 수 있다. 이렇게 채널간 위상차이 값이 크게 변동되는 지점에서는 예상치 못한 잡음(noise)이 발생할 수 있다. 따라서, 본 발명의 신호 처리 방법 및 장치는 이전 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값을 이용하여 현재 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값을 스무딩(smoothing)함으로써 잡음을 제거할 수 있는 효과를 갖는다.
다시 도 8을 참조하면, 현재 파라미터 타임 슬롯을 파라미터 타임 슬롯[1]이라고 할 때, 이전 파라미터 타임 슬롯은 파라미터 타임 슬롯[0]일 수 있다. 도 8의 오른쪽 하단의 그래프에 나타난 바와 같이, 현재 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값(60°)는 이전 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값(10°)를 이용하여 스무딩될 수 있고, 따라서 스무딩되어 수정된 현재 파라미터 타임 슬롯의 채널간 위상차이 값은 60°보다 작은 값을 가질 수 있다.
이후, 현재 및/또는 이전 파라미터 타임 슬롯에 적용되는 상기 스무딩된 채널간 위상차이 값들을 보간(interpolation) 및/또는 복사함으로써, 파라미터 세트가 적용되도록 정의되지 아니한 타임 슬롯, 예를 들면, 타임 슬롯 1, 타임 슬롯 3, ..., 타임 슬롯 N에 적용되는 채널간 위상차이 값을 획득할 수 있다.
도 9는 도 8의 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다. 도 9의 다운믹싱부(910), IPD 이용결정부(921), IPD 값 측정부(922), IPD 모드 플래그 생성부(923), IPD 코딩 플래그 생성부(924), IPD 코딩 플래그 획득부(931), IPD 모드 플래그 획득부(932), IPD 값 획득부(933), 업믹싱부(940)는 도 2의 다운믹싱부(210), IPD 이용결정부(221), IPD 값 측정부(222), IPD 모드 플래그 생성부(223), IPD 코딩 플래그 생성부(224), IPD 코딩 플래그 획득부(231), IPD 모드 플래그 획득부(232), IPD 값 획득부(233) 및 업믹싱부(240)와 그 구성 및 기능이 동일하므로 상세한 설명을 생략하기로 한다.
정보 획득부(930)는 IPD 값 스무딩부(934)를 더 포함할 수 있다. IPD 값 스무딩부(934)는 이전 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값을 이용하여 현재 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값을 수정할 수 있다. 이와 같이, 현재 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값이 이전 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값과 큰 차이(gap)를 갖는 경우, 발생할 수 있는 잡음을 방지하는 효과를 갖는다.
또한, IPD 값 스무딩부(934)는 현재 파라미터 타임 슬롯에 적용되는 채널간 위상차이 값으로부터 복수채널 중 두 채널 사이의 각도를 나타내는 위상각도(angle)를 생성할 수 있고, 상기 위상각도를 상기 이전 파라미터 타임 슬롯의 위상각도를 이용하여 수정할 수 있다. 상기 수정된 위상각도는 이후 업믹싱부(640)로 출력된다. 상기 수정된 위상각도는 업믹싱부(640)에서 다운믹스 신호에 적용되어 복수채널 신호를 생성할 수 있다.
이하에서는, 일반적으로 채널간 위상차이 값을 이용하지 아니하고, 채널간 레벨차이 및 채널간 상관값을 이용하여 신호를 코딩하는 경우, 발생하는 문제점을 해결하기 위한 본 발명의 여러가지 실시예에 대하여 살펴보기로 한다.
도 10A 및 도 10B는 본 발명의 또다른 실시예에 따른 신호 처리 방법 및 장치가 해결하고자 하는 문제점을 나타내는 개념도이다.
많은 신호 코딩 장치에서, 특히, 3GPP 와 MPEG에서 규격화된 EAAC+와 HE AAC Plus 그리고 USAC에서 사용하는 PS에서는 채널간 위상차이 값을 이용하지 아니하고, 채널간 레벨차이 값과 채널간 상관 정보만을 공간정보로 이용하고 있다. 이는 채널간 위상차이 값을 생성할 때 발생할 수 있는 위상 래핑(phase wrapping) 현상과 채널간 위상차이 값을 합성할 때 발생하는 음질의 저하 때문이다.
그러나, 채널간 위상차이 값을 이용하지 않고 복수채널 신호를 코딩하는 경우, 심각한 음상 정위(localization) 문제가 발생할 수 있다. 다시 말해, 두 개 이상의 마이크들을 서로 인접하게 배치하여 녹음된 신호와 같이 채널간 레벨차이 값을 주로 이용하여 코딩한 신호에서는 문제가 발생하지 아니할 수 있으나, 두 개 이상의 마이크들을 서로 이격하여 배치하여 녹음된 신호는 채널간 위상차이 값을 이용하지 아니하면 복수채널 신호의 디코딩시 정확한 음상 정위를 할 수 없게 된다.
도 10A는 채널간 위상차이 값만이 존재하는 스테레오 신호를 채널간 위상차이 값없이 디코딩하는 경우의 결과를 나타낸다. 도 10A를 참조하면, 원래 신호(original)가 채널간 위상차이 값만으로 형성된 신호이다(IPD=30°). 그러나, 채널간 레벨차이 값 및 채널간 상관값만을 이용하여 디코딩하면 유효한 공간정보(IPD 값)가 없으므로 디코딩된 신호(synthesis신호)의 음상은 원래 신호와 상관없이 스테레오 신호의 중앙에 위치하게 된다. 이 때, 채널간 상관값이 음상 정위에 영향을 미치기는 하지만 채널간 위상차이 값이 없이 정확한 음상 정위는 불가능하다.
한편, 도 10B는 채널간 위상차이 값 및 채널간 레벨차이 값이 섞여있는 스테레오 신호를 채널간 위상차이 값없이 디코딩하는 경우의 결과를 나타낸다. 도 10B를 참조하면, 스테레오 신호의 음상 정위는 채널간 위상차이 값으로부터 결정되는 조절각도와 채널간 레벨차이 값으로부터 결정되는 조절각도의 선형적인 합으로 결정된다. 원래 스테레오 신호가 도 10B에 나타난 바와 같이 왼쪽 신호가 오른쪽 신호보다 8dB 더 큰 값을 갖고, 0.5ms 더 빠른 경우, 8dB의 레벨차이는 음상을 중앙에서 왼쪽으로 20°(-20°) 이동시킬 수 있고, 0.5ms의 시간차이(-10°인 채널간 위상차이 값과 동일)는 음상을 왼쪽으로 10°(-10°) 이동시킬 수 있는 특징을 가진다. 따라서, 원래 스테레오 신호(original)는 -30° 위치에 존재하게 된다. 그러나, 채널간 위상차이 값없이 신호를 디코딩하면 디코딩된 신호의 음상은 -20°에 위치하게 되므로 정확한 음상의 정위가 불가능하다.
따라서, 본 발명의 또다른 실시예에 따른 신호 처리 방법 및 장치는 음상정위 문제를 해결하기 위하여 여러가지 방법을 추가적으로 제공한다.
도 11 및 도 12는 본 발명의 또다른 실시예에 따른 신호 처리 방법 및 장치를 나타내는 블록도이다.
첫째로, 복수채널 신호의 채널간 위상차이정보 및 채널간 레벨차이 값의 비율에 기초하여 일정 조건을 만족하는 경우에만 채널간 위상차이정보를 이용할 수 있다. 도 11에 나타난 바와 같이, 신호 처리 장치(1100)는 다운믹싱부(1110), 공간정보 생성부(1120), 정보 획득부(1130) 및 업믹싱부(1140)를 포함한다.
다운믹싱부(1110) 및 업믹싱부(1140)는 상술한 도 2의 다운믹싱부(210) 및 업믹싱부(240)와 그 구성 및 기능이 동일하다. 공간정보 생성부(1120)는 ILD 값 측정부(1121), IPD 값 측정부(1122), 정보 결정부(1123) 및 IPD 플래그 생성부(1124)를 포함한다. ILD 값 측정부(1121) 및 IPD 값 측정부(1122)는 복수채널 신호로부터 채널간 레벨차이 값 및 채널간 위상차이 값을 측정한다. 상기 채널간 레벨차이 값 및 상기 채널간 위상차이 값은 파라미터 밴드별로 측정될 수 있다.
정보 결정부(1123)는 측정된 채널간 레벨차이 값 및 채널간 위상차이 값을 이용하여 신호가 얼마나 음상정위되는지 계산하고, 채널간 레벨차이 값과 채널간 위상차이 값이 전체 음상정위 중 어느정도의 비율을 차지하는지 계산하여 채널간 위상차이 값의 비율이 더 높은 경우에만 채널간 위상차이 값을 이용하도록 결정한다. 예를 들어, 측정된 채널간 위상차이 값이 +20°에 대응하고, 측정된 채널간 레벨차이 값이 4dB로 +10° 위상이동 시킬 수 있는 값에 대응하는 경우, 전체 음상정위(20°+10°=30°) 중 채널간 위상차이 값과 채널간 레벨차이 값이 기여하는 정도는 각각 20/30, 10/30일 수 있다. 이 경우, 채널간 위상차이 값의 상대적인 중요성이 크다고 할 수 있으므로, 정보 결정부(1123)는 채널간 위상차이 값을 더 이용하기로 결정할 수 있다.
IPD 플래그 생성부(1124)는 정보 결정부(1123)에서 채널간 위상차이 값을 더 이용하기로 결정하면 채널간 위상차이 값이 이용됨을 나타내는 채널간 위상차이 값 플래그를 생성할 수 있다.
한편, 정보 획득부(1130)는 IPD 플래그 획득부(1131) 및 IPD 값 획득부(1132)를 포함할 수 있고, IPD 플래그 획득부(1131)는 상기 채널간 위상차이 값 플래그를 획득하여 공간정보에 채널간 위상차이 값이 포함되었는지 여부를 판단한다. 상기 채널간 위상차이 값 플래그가 1인 경우 IPD 값 획득부(1132)가 활성화되어 공간정보로부터 채널간 위상차이 값을 획득한다. 이후, 업믹싱부(1140)는 채널간 위상차이 값을 포함한 공간정보를 이용하여 다운믹스 신호를 업믹싱하여 복수채널 신호를 디코딩하고, 채널간 위상차이 값을 이용하지 아니하는 경우에 비하여 복수채널 신호의 정확한 음상정위가 가능하게 된다. 또한, 일정 조건을 만족시키는 경우에만 채널간 위상차이 값을 전송함으로써 코딩 효율도 높일 수 있다.
둘째로, 채널간 위상차이 값은 등가적인 채널간 레벨차이 값으로 대치될 수 있고, 이는 반대로도 마찬가지이다. 이 때, 음상정위에 필요한 채널간 위상차이 값 및 채널간 레벨차이 값은 주파수에 따라 달라질 수 있으므로, 주파수 밴드별로 정의된 데이터베이스를 참고한다.
도 12는 채널간 위상차이 값을 등가적인 채널간 레벨차이 값으로 변경하여 이용하는 신호 처리 장치(1200)를 나타낸다. 신호 처리 장치(1200)는 ILD 값 측정부(1210), IPD 값 측정부(1220), 정보 결정부(1230), IPD 값 변환부(1240) 및 ILD 값 수정부(1250)를 포함한다.
ILD 값 측정부(1210), IPD 값 측정부(1220) 및 정보 결정부(1230)는 도 11의 ILD 값 측정부(1121), IPD 값 측정부(1122) 및 정보 결정부(1130)과 그 구성 및 기능이 동일하므로 상세한 설명을 생략한다. 정보 결정부(1130)에서 채널간 위상차이 값을 이용하기로 결정한 경우, 측정된 채널간 위상차이 값은 IPD 값 변환부(1240)로 입력된다.
IPD 값 변환부(1240)는 상기 데이터베이스를 이용하여 해당 주파수 밴드에서 측정된 채널간 위상차이 값을 등가적인 채널간 레벨차이 값(ILD')으로 변환시킨다. 이후, ILD 값 수정부(1250)는 ILD 값 측정부(1210)로부터 입력된 채널간 레벨차이 값(ILD)에 채널간 위상차이 값이 변환된 채널간 레벨차이 값(ILD')을 더하여 수정된 채널간 레벨차이 값(ILD'')을 계산한다.
이와 같이, 채널간 위상차이 값을 등가적인 채널간 레벨차이 값으로 변환하여 이용하는 경우, 3GPP와 MPEG에서 이용하는 HE AAC Plus 또는 USAC 표준에서 이용하는 PS 등 채널간 위상차이 값의 수신을 허용하지 아니하는 기존의 신호 처리 장치 및 방법을 이용하여서도 채널간 위상차이 값을 반영하여 공간감 및 음상정위가 향상된 신호를 디코딩할 수 있게 된다.
셋째로, 채널간 위상차이 값을 연속되는 적어도 하나 이상의 프레임에 공통으로 적용함으로써 정확한 음상 정위와 더불어 코딩 효율을 높일 수 있다. 본 명세서에서 연속인 몇 개의 프레임에서 이용되는 채널간 위상차이 값을 글로벌 프레임 채널간 위상차이 값(global frame IPD value)라고 지칭한다.도 13은 본 발명의 또다른 실시예에 따라 글로벌 프레임 채널간 위상차이 값이 이용되는 개념을 나타내는 개념도이다. 도 13을 참조하면, 숫자 0~13은 각각 프레임을 나타내고, 음영이 있는 프레임은 채널간 위상차이 값을 이용하는 프레임, 음영이 없는 프레임은 채널간 위상차이 값이 이용되지 아니하는 프레임을 나타낸다. 이들은 본 명세서에서 상술한 채널간 위상차이 모드 플래그(bsPhaseMode)에 기초하여 결정될 수 있다.
도 13에 나타난 바와 같이, 프레임 1~3 및 프레임 8~12만이 채널간 위상차이 값을 이용하는 경우, 채널간 위상차이 값을 각 프레임마다 전송하지 아니하고 대표값을 계산하여 채널간 위상차이 값을 적용하도록 결정된 연속 프레임에 동일하게 적용하고, 연속되는 프레임 중 첫번째 프레임에만 글로벌 프레임 채널간 위상차이 값을 포함하며, 매 프레임은 글로벌 프레임 채널간 위상차이 값을 이용하는지 여부를 나타내는 글로벌 프레임 채널간 위상차이 플래그를 포함할 수 있다. 글로벌 프레임 채널간 위상차이 플래그의 의미는 하기 표 4와 같다.
Global_frame_IPD_flag 의미
1 글로벌 프레임 채널간 위상차이 값을 이용함
0 글로벌 프레임 채널간 위상차이 값을 이용하지 아니함
예를 들면, 글로벌 프레임 채널간 위상차이 플래그에 기초하여 프레임 0은 글로벌 프레임 채널간 위상차이 값을 이용하지 아니하고, 프레임 1은 글로벌 프레임 채널간 위상차이 값을 이용한다. 따라서, 프레임 1은 글로벌 프레임 채널간 위상차이 값을 포함하고, 동일한 글로벌 프레임 채널간 위상차이 값은 프레임 1 내지 3에 적용될 수 있다. 마찬가지로, 프레임 8은 글로벌 프레임 채널간 위상차이 값을 포함하고, 동일한 글로벌 프레임 채널간 위상차이 값이 프레임 8 내지 12에 적용될 수 있다.
도 14는 도 13의 글로벌 프레임 채널간 위상차이 값을 이용하는 본 발명의 실시예에 따른 신호 코딩 장치(1400)를 나타낸다. 도 14를 참조하면, 신호 코딩 장치(1400)는 이전 프레임의 글로벌 프레임 IPD 값 수신부(1410), 글로벌 프레임 IPD 값 계산부(1420), 글로벌 프레임 IPD 플래그 생성부(1430), 글로벌 프레임 IPD 플래그 획득부(1440), 글로벌 프레임 IPD 값 획득부(1450), 업믹싱부(1460)를 포함한다.
이전 프레임의 글로벌 프레임 IPD 값 수신부(1410)는 이전 프레임(previous frame)의 글로벌 프레임 채널간 위상차이 값을 수신한다. 예를 들어, 현재 프레임이 글로벌 프레임 채널간 위상차이 값을 포함하는 첫번째 프레임인 경우에는 수신되는 이전 프레임의 글로벌 프레임 채널간 위상차이 값이 존재하지 않을 것이다. 반면, 현재 프레임이 글로벌 프레임 채널간 위상차이 값을 포함하는 연속하는 프레임 중 두번째 이상의 프레임인 경우에는 이전 프레임으로부터 글로벌 프레임 채널간 위상차이 값을 수신받을 수 있다.
글로벌 프레임 IPD 값 계산부(1420)는 현재 프레임이 글로벌 프레임 채널간 위상차이 값을 포함하는 첫번째 프레임인 경우, 다시 말해, 이전 프레임의 글로벌 프레임 채널간 위상차이 값이 존재하지 아니하는 경우 글로벌 프레임 채널간 위상차이 값을 계산할 수 있다. 현재 프레임의 글로벌 프레임 채널간 위상차이 값은 채널간 위상차이 값이 이용되는 연속하는 프레임의 채널간 위상차이 값의 평균일 수 있다.
글로벌 프레임 IPD 플래그 생성부(1430)는 현재 프레임에서 글로벌 프레임 채널간 위상차이 값(IPD)를 이용하는지 여부를 나타내는 글로벌 프레임 IPD 플래그(global_frame_IPD_flag)를 생성한다.
이후, 글로벌 프레임 IPD 플래그 값 획득부(1440)는 글로벌 프레임 채널간 위상차이 값을 획득하고, 글로벌 프레임 IPD 값 획득부(1450)는 이전 프레임의 글로벌 프레임 IPD 값 수신부(1410)로부터 출력된 이전 프레임의 글로벌 프레임 채널간 위상차이 값 또는 글로벌 프레임 IPD 값 계산부(1420)로부터 출력된 현재 프레임의 글로벌 프레임 채널간 위상차이 값을 획득할 수 있다. 바람직하게는, 글로벌 프레임 IPD 값 획득부(1450)는, 현재 프레임이 채널간 위상차이 값을 적용하는 연속하는 프레임 중 첫번째 프레임인 경우 이전 프레임의 글로벌 프레임 채널간 위상차이 값을 획득하고, 두번째 이상의 프레임인 경우에는 계산된 현재 프레임의 글로벌 프레임 채널간 위상차이 값을 획득할 수 있다.
업믹싱부(1460)는 다운믹스 신호에 글로벌 프레임 채널간 위상차이 값을 적용하여 복수채널 신호를 생성한다.
넷째로, 디코딩된 복수채널 신호가 인코더에 입력된 복수채널 신호의 공간감과 최대한 가깝게 조절하기 위하여 채널간 상관값을 조절할 수 있다. 도 10B를 다시 참조하면, 채널간 위상차이 값 및 채널간 상관값을 이용하여 신호를 디코딩하는 경우, 원래 신호(original)보다 공간감이 과장되는 문제점이 발생한다. 상기 공간감이란 주변음(ambience)에 의하여 신호가 넓은 공간 또는 좁은 공간에서 존재하는 듯한 효과를 지칭하며, 본 명세서에서 공간감이 과장된다는 것은 원래 신호는 좁은 녹음실에서 녹음되었으나, 디코딩시 넓은 강당에서 녹음된 것처럼 들리는 것을 의미한다.
이러한 문제점은 채널간 위상차이 값을 전송하지 아니하는 종래의 신호 처리 방법 및 장치에서 많이 발생하나, 채널간 위상차이 값을 전송하는 경우에도 발생할 수 있다.
도 15는 상기 문제점을 해결하기 위한 본 발명의 또다른 일실시예에 따른 신호 처리 장치(1500)를 나타내는 블록도이다. 신호 처리 장치(1500)는 ICC 값 측정부(1510), IPD 값 측정부(1520), ILD 값 측정부(1530), 정보 결정부(1540), ICC 값 수정부(1550), IPD 모드 플래그 생성부(1560), IPD 모드 플래그 획득부(1570), IPD 값 획득부(1580), ICC 값 획득부(1590) 및 업믹싱부(1595)를 포함한다. ICC 값 측정부(1510), IPD 값 측정부(1520) 및 ILD 값 측정부(1530)는 복수채널 신호로부터 각각 채널간 상관값, 채널간 위상차이 값 및 채널간 레벨차이 값을 측정할 수 있다.
정보 결정부(1540) 및 IPD 모드 플래그 생성부(1560)는 도 11의 정보 결정부(1123) 및 IPD 플래그 생성부(1124)와 그 구성 및 기능이 동일하다. 또한, 정보 결정부(1540)는 측정된 채널간 레벨차이 값 및 채널간 위상차이 값이 전체 음상정위 중 어느정도의 비율을 차지하는지 계산하여 채널간 위상차이 값의 비율이 더 높은 경우에만 채널간 위상차이 값을 이용하도록 결정하며, IPD 모드 플래그 생성부(1560)는 채널간 위상차이 값을 이용하는지 여부를 나타내는 채널간 위상차이 모드 플래그를 생성한다.
ICC 값 수정부(1550)는 정보 결정부(1540)가 채널간 위상차이 값을 이용하는 것으로 결정한 경우, ICC 값 측정부(1510)로부터 입력된 채널간 상관값을 수정할 수 있다. 바람직하게는, 채널간 위상차이 값을 포함하는 파라미터 밴드에서는 측정된 채널간 상관값을 이용하지 아니할 수 있고, 공간감이 과장되는 문제점을 해결하기 위하여 채널간 상관값이 나타내는 값의 크기를 수정해 이용할 수 있다.
IPD 플래그 획득부(1570) 및 IPD 값 획득부(1580)도 도 11의 IPD 플래그 획득부(1131) 및 IPD 값 획득부(1132)와 그 구성 및 기능이 동일하므로 상세한 설명을 생략한다.
ICC 값 획득부(1590)는 IPD 플래그 획득부(1570)에서 채널간 위상차이 플래그가 채널간 위상차이 값이 이용되었음을 나타내는 경우, ICC 값 수정부(1550)로부터 수정된 채널간 상관값을 수신받는다.
업믹싱부(1595)는 수신된 다운믹스 신호에 채널간 위상차이 값 및 수정된 채널간 상관값을 적용하여 복수채널 신호를 생성할 수 있다. 따라서, 채널간 위상차이 값을 이용하는 신호 처리 방법 및 장치에서 채널간 상관값에 의하여 공간감이 과장되어 신호가 왜곡되는 것을 방지할 수 있다.
다섯째로, 채널간 위상차이 값은 단순한 음원을 갖는 신호일수록 더 중요도가 크다는 특징을 이용할 수 있다.
도 16은 본 발명의 또다른 실시예에 따른 신호 처리 장치(1600)를 나타내는 블록도이다. 신호 처리 장치(1600)는 입력 신호 분류부(1610), IPD 값 획득부(1620), IPD 플래그 생성부(1630), IPD 플래그 획득부(1640), IPD 값 획득부(1650) 및 업믹싱부(1660)를 포함할 수 있다.
입력 신호 분류부(1610)는 입력 신호가 음성(speech)만을 포함하는 신호인지(if pure-speech signal), 음악 신호이거나 음악 신호 및 음성 신호가 혼합된 신호인지(mixed signal)인지를 판단한다. 바람직하게는 입력 신호 분류부(1610)는 SAD(Sound Activity Detector) 또는 SMC(Speech and Music Classifier) 등을 포함할 수 있다.
IPD 값 측정부(1620)는 입력 신호 분류부(1610)에서 입력 신호를 음성 신호만을 포함하는 신호로 판단하는 경우에만 채널간 위상차이 값을 측정한다. 이후의 IPD 플래그 생성부(1630), IPD 플래그 획득부(1640), IPD 값 획득부(1650) 및 업믹싱부(1660)는 도 11의 IPD 플래그 생성부(1124), IPD 플래그 획득부(1131), IPD 값 획득부(1132) 및 업믹싱부(1140)와 그 구성 및 기능이 동일하므로 상세한 설명을 생략한다.
여러가지 신호가 포함되는 음악(music) 신호나 음성 신호에 음악 신호가 혼합된 혼합(mixed) 신호는 채널간 위상차이 값이 이용되지 아니하더라도 채널간 레벨차이 값 및 채널간 상관값을 이용하여 어느 정도의 음상 정위가 가능하다. 그러나, 음성(speech) 신호와 같이 단순한 음원의 경우에는 채널간 위상차이 값의 중요도가 상대적으로 높기 때문에 채널간 위상차이 값 없이는 정확한 음상정위가 불가능하다. 따라서, 입력 신호 분류부(1610)를 이용하여 입력 신호가 음성 신호인 경우 채널간 위상차이 값을 이용함으로써, 보다 정확하게 음상정위된 복수채널 신호를 디코딩할 수 있게 된다.
도 17은 본 발명의 또다른 실시예에 따른 신호 처리 장치(1700)를 나타낸 것이고, 이는 복수채널 인코딩부(1710), 대역폭 확장신호 인코딩부(1720), 오디오 신호 인코딩부(1730), 음성 신호 인코딩부(1740), 오디오 신호 디코딩부(1750), 음성 신호 디코딩부(1760), 대역폭 확장신호 디코딩부(1770) 및 복수채널 디코딩부(1780)를 포함한다.
먼저, 복수채널 인코딩부(1710)에서 이하에서는, 복수채널 신호를 다운믹싱하여 생성하는 다운믹스 신호를 전대역 다운믹스 신호라 지칭하고, 추후 상기 전대역 다운믹스 신호로부터 고주파 대역의 신호가 제거되어 저주파 대역만이 존재하는 다운믹스 신호를 저주파 대역 다운믹스 신호라 지칭한다.
복수채널 인코딩부(1710)는 복수개의 채널을 갖는(이하, 복수채널) 신호를 입력받는다. 입력된 복수채널 신호를 다운믹싱하여 전대역 다운믹스 신호를 생성하는 한편, 복수채널 신호에 대응하는 공간정보를 생성한다. 상기 공간정보는 채널 레벨 차이정보, 채널 예측 계수, 채널간 상관값 및 다운믹스 게인 정보 등을 포함할 수 있다.
본 발명의 일실시예에 따른 복수채널 인코딩부(1710)는 채널간 위상차이 값을 이용하는지 여부를 결정하여 채널간 위상차이 값을 측정하고, 프레임에서 채널간 위상차이 값을 이용하는지 여부를 나타내는 채널간 위상차이 모드 정보 및 전체 프레임 중 채널간 위상차이 값을 이용하는 프레임이 있는지 여부를 나타내는 채널간 위상차이 코딩 정보를 생성하여 이들을 믹스정보와 함께 전송할 수 있는데, 이는 도 1 내지 도 4를 참조하여 서술한 바와 같으므로, 이 과정에 대한 구체적인 설명은 생략하기로 한다.
반면, 복수채널 인코딩부(1710)에서는 도시하지 아니하였으나, 도 1 내지 도 4를 참조하여 설명한 신호 처리 장치 또는 도 5 내지 도 16을 참조하여 설명한 본 발명의 또다른 실시예에 따른 신호 처리 장치 중 인코딩 장치를 포함할 수 있다.
대역폭 확장신호 인코딩부(1720)는 상기 전대역 다운믹스 신호를 입력받아, 상기 전대역 다운믹스 신호 중 고주파 대역의 신호에 대응하는 확장정보를 생성할 수 있다. 상기 확장정보는 추후 디코더단에서 고주파 대역이 제거된 저주파 대역 다운믹스 신호를 상기 전대역 다운믹스 신호로 복원하기 위한 정보이고, 공간정보와 함께 전송할 수 있다.
또한, 다운믹스 신호는 신호의 특성에 기초하여 오디오 신호 코딩 방식 또는 음성 신호 코딩 방식으로 코딩될지 결정되고, 상기 코딩방식을 결정하는 모드정보를 생성한다(미도시). 이 때, 상기 오디오 코딩 방식은 MDCT(Modified Discrete Cosine Transform)을 이용하는 것일 수 있으나, 본 발명은 이에 한정되지 아니한다. 상기 음성 코딩 방식(speech coding scheme)은 AMR-WB(Adaptive multi-rate Wide-Band) 표준에 따른 것일 수 있으나, 본 발명은 이에 한정되지 아니한다.
오디오 신호 인코딩부(1730)는 대역폭 확장신호 인코딩부(1720)로부터 입력된 확장정보 및 전대역 다운믹스 신호를 이용하여 고주파 영역이 제거된 저주파 대역 다운믹스 신호를 오디오 신호 코딩 방식에 따라 인코딩한다.
상기 오디오 신호 코딩 방식으로 코딩되는 신호는, 오디오 신호일 수 있고, 오디오 신호에 일부 음성 신호가 포함된 신호일 수 있다. 또한, 오디오 신호 인코딩부(1730)는 주파수 도메인 인코딩부일 수 있다.
음성 신호 인코딩부(1740)는 대역폭 확장신호 인코딩부(1720)로부터 입력된 확장정보 및 전대역 다운믹스 신호를 이용하여 고주파 영역이 제거된 저주파 대역 다운믹스 신호를 음성 신호 코딩 방식에 따라 인코딩한다.
상기 음성 신호 코딩 방식으로 코딩되는 신호는, 음성 신호일 수 있고, 음성 신호에 일부 오디오 신호가 포함된 신호일 수 있다. 또한, 음성 신호 인코딩부(1740)는 선형 예측 부호화(LPC: Linear Prediction Coding) 방식을 더 이용할 수 있다. 입력 신호가 시간축 상에서 높은 중복성을 가지는 경우, 과거 신호로부터 현재 신호를 예측하는 선형 예측에 의해 모델링될 수 있는데, 이 경우 선형 예측 부호화 방식을 채택하면 부호화 효율을 높일 수 있다. 한편, 음성 신호 인코딩부(1740)는 시간 도메인 인코딩부일 수 있다.
이후, 오디오 신호 디코딩부(1750)는 신호를 오디오 신호 코딩 방식에 따라 디코딩한다. 오디오 신호 디코딩부(1750)에 입력되어 디코딩되는 신호는 오디오 신호일 수 있고, 오디오 신호에 일부 음성 신호가 포함된 신호일 수 있다. 또한, 오디오 신호 디코딩부(1750)는 주파수 도메인 디코딩부를 포함할 수 있고, IMDCT(Inverse Modified Discrete Coefficient Tramsform) 를 이용할 수 있다.
음성 신호 디코딩부(1760)는 신호를 음성 신호 코딩 방식에 따라 디코딩한다. 음성 신호 디코딩부(1760)에서 디코딩되는 신호는 음성 신호일 수 있고, 음성 신호에 일부 오디오 신호가 포함된 신호일 수 있다. 또한, 음성 신호 디코딩부(1760)는 시간 도메인 디코딩부를 포함할 수 있고, 선형 예측 부호화(LPC: Linear Prediction Coding) 방식을 더 이용할 수 있다.
대역폭 확장 디코딩부(1770)는 오디오 신호 디코딩부(1750)로 디코딩된 신호 또는 음성 신호 디코딩부(1760)로 디코딩된 신호인 저주파 대역 다운믹스 신호 및 확장정보를 입력받아, 인코딩시 제거된 고주파 영역에 해당하는 신호가 복원된 전대역 다운믹스 신호를 생성한다.
상기 전대역 다운믹스 신호는, 상기 저주파 대역 다운믹스 신호 전부 및 상기 확장정보를 이용하여 생성될 수 있을 뿐만 아니라, 상기 저주파 대역 다운믹스 신호의 일부를 이용하여 생성될 수도 있다.
복수채널 디코딩부(1780)는 상기 전대역 다운믹스 신호, 공간정보, 채널간 위상차이 값, 채널간 위상차이 모드 플래그 및 채널간 위상차이 코딩 플래그를 입력받아, 상기 정보들을 상기 전대역 다운믹스 신호에 적용하여 복수채널 신호를 생성하는데, 이 과정에 대한 상세한 설명은 도 1 내지 도 4를 참조하여 상세하게 서술하였으므로 이를 생략하기로 한다.
이와 같이, 본 발명의 신호 처리 방법 및 장치는, 채널간 위상차이 값을 이용하여 복수 채널 신호를 생성함으로써, 복수채널 디코더가 재생하기 어려운 위상 차이 또는 딜레이 차이를 효과적으로 재생할 수 있게 한다.
도 18은 본 발명의 일실시예에 따른 IPD 코딩 플래그 획득부(1841), IPD 모드 플래그 획득부(1842), IPD 값 획득부(1843) 및 업믹싱부(1844)가 구현된 제품의 개략적인 구성을 보여주는 도면이고, 도 19는 본 발명의 실시예에 따른 IPD 코딩 플래그 획득부(1841), IPD 모드 플래그 획득부(1842), IPD 값 획득부(1843) 및 업믹싱부(1844) 가 구현된 제품들의 관계를 보여주는 도면이다.
도 18을 참조하면, 유무선 통신부(1810)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(1810)는 유선통신부(1811), 적외선통신부(1812), 블루투스부(1813), 무선랜통신부(1814) 중 하나 이상을 포함할 수 있다.
사용자 인증부는(1820)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부(1821), 홍채인식부(1822), 얼굴인식부(1823), 및 음성인식부(1824) 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(1830)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부(1831), 터치패드부(1832), 리모컨부(1833) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다.
신호 디코딩부(1840)는 IPD 코딩 플래그 획득부(1841), IPD 모드 플래그 획득부(1842), IPD 값 획득부(1843) 및 업믹싱부(1844)를 포함하는데, 이들은 도 2의 동일한 명칭을 갖는 유닛과 그 구성 및 기능이 동일하므로 상세한 설명은 생략하기로 한다.
제어부(1850)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부(1840)와 출력부(1860)의 모든 프로세스를 제어한다. 상술한 바와 같이, 제어부(1850)에 입력부(1830)로부터 사용자 입력, 예를 들면, 출력 신호의 위상이동의 on/off, 메타데이터의 입/출력, 신호 디코딩부의 작용 on/off 등이 입력되는 경우, 이를 이용하여 신호를 디코딩한다.
출력부(1860)는 신호 디코딩부(1840)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 신호 출력부(1861) 및 디스플레이부(1862)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 신호 출력부(1861)를 통하여 출력되고, 비디오 신호일 때 출력 신호는 디스플레이부(1862)를 통해 출력된다. 또한, 입력부(1830)에 메타데이터가 입력된 경우에는 이를 디스플레이부(1862)를 통하여 화면에 현시한다.
도 19는 도 18에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서, 도 19A를 참조하면, 제1 단말(1910) 및 제2 단말(1920)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있음을 알 수 있다. 상기 유무선 통신부를 통해서 통신하는 데이터 또는 비트스트림은 본 발명의 도 1의 비트스트림의 형태일 수 있고, 도 5 내지 도 16을 참조하여 설명한 본 발명의 위상이동 플래그, 글로벌 프레임 채널간 위상차이 값 등을 포함하는 데이터일 수 있다. 도 19B를 참조하면, 서버(1930) 및 제1 단말(1940) 또한 서로 유무선 통신을 수행할 수 있음을 알 수 있다.
도 20은 본 발명의 일실시예에 따른 IPD 코딩 플래그 획득부(2041), IPD 모드 플래그 획득부(2042), IPD 값 획득부(2043) 및 업믹싱부(2044)를 포함하는 복수채널 디코딩부가 구현된 방송신호 디코딩 장치(2000)의 개략적인 구성을 보여주는 도면이다.
도 20을 참조하면, 디멀티플렉서(2020)는 튜너(2010)로부터 TV방송과 관련된 데이터들을 수신한다. 수신된 데이터들은 디멀티플렉서(2020)에서 분리되고, 데이터 디코더(2030)를 통하여 디코딩된다. 한편, 디멀티플렉서(2020)에서 분리된 데이터들은 HDD 와 같은 저장매체(2050)에 저장될 수 있다.
디멀티플렉서(2020)에서 분리된 데이터들은 복수채널 디코딩부(2041) 및 비디오 디코딩부(2042)를 포함하는 신호 디코딩부(2040)로 입력되어 오디오 신호 및 비디오 신호를 디코딩한다. 신호 디코딩부(2040)는 본 발명의 일실시예에 따른 IPD 코딩 플래그 획득부(2041), IPD 모드 플래그 획득부(2042), IPD 값 획득부(2043) 및 업믹싱부(2044) 를 포함하고, 이는 도 2의 동일한 명칭의 유닛들과 그 구성 및 기능이 동일하므로 상세한 설명을 생략하기로 한다. 신호 디코딩부(2040)는 수신된 채널간 위상차이 값 등을 이용하여 신호를 디코딩하고, 비디오 신호가 입력되는 경우 비디오 신호도 디코딩하여 출력하며, 메타데이터가 생성되는 경우에는 이를 텍스트 형태로 출력한다.
출력부(2070)는 비디오 신호가 디코딩되는 경우, 출력된 비디오 신호와 메타데이터가 생성되는 경우, 출력된 메타데이터를 화면에 현시한다. 또한, 출력부(2070)는 스피커부(미도시)를 포함하고, 신호 디코딩부(2040)에서 출력되는 채널간 위상차이 값을 이용하여 디코딩된 복수채널 신호를 출력부(2070)에 포함된 스피커부를 통하여 출력한다. 또한, 신호 디코딩부(2040)에서 디코딩된 데이터들은 HDD 와 같은 저장매체(2050)에 저장될 수 있다.
한편, 신호 디코딩 장치(2000)는 사용자로부터 정보를 입력받아 수신된 데이터들을 제어할 수 있는 애플리케이션 매니저(2060)를 더 포함할 수 있다. 애플리케이션 매니저(2060)는 유저 인터페이스 매니저(2061) 및 서비스 매니저(2062)를 포함하는데, 유저 인터페이스 매니저(2061)는 사용자로부터 정보를 입력받기 위한 인터페이스(interface)를 제어한다. 예를 들면, 출력부(2070)에 현시되는 텍스트의 글자체, 화면의 밝기, 메뉴 구성 등을 제어할 수 있다. 한편, 서비스 매니저(2062)는 신호 디코딩부(2040) 및 출력부(2070)에서 방송신호를 디코딩하여 출력하는 경우, 수신되는 방송신호를 사용자로부터 입력되는 정보를 이용하여 제어할 수 있다. 예를 들면, 방송채널의 설정, 알람 기능 설정, 성인인증 기능 등을 제공할 수 있다. 애플리케이션 매니저(2060)에서 출력되는 데이터들은 신호 디코딩부(2040)뿐만 아니라, 출력부(2070)로도 전송되어 이용가능하다.
이와 같이, 실제 제품에 본 발명의 신호 처리 장치가 포함됨으로써, 채널간 레벨차이 값 및 채널간 상관값만을 이용하여 업믹싱된 복수채널 신호를 이용하는 종래의 기술에 비하여, 채널간 위상차이 값을 이용함으로써 보다 음질이 향상되고 원 입력신호에 가까운 복수채널 신호를 청취할 수 있는 효과가 있다.
본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.
도 1은 본 발명의 일실시예에 따른 신호 처리 방법의 개념을 나타내는 개념도이다.
도 2는 본 발명의 일실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 3은 신호(signal)에서 위상(phase)와 시간(time)과의 관계를 나타내는 그래프이다.
도 4는 도 2의 IPD 값 측정부 및 IPD 값 획득부를 구체적으로 나타내는 블록도이다.
도 5는 본 발명의 다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 6은 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 7은 종래의 파라미터 타임 슬롯을 나타내는 개념도이다.
도 8은 본 발명의 또다른 실시예에 따라 채널간 위상차이 값을 수정(smoothing)하는 방법을 나타내는 개략도이다.
도 9는 도 8의 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 10a 및 도 10b는 본 발명의 또다른 실시예에 따른 신호 처리 방법 및 장치가 해결하고자 하는 문제점을 나타내는 개념도이다.
도 11및 도 12는 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내 는 블록도이다.
도 13은 본 발명의 또다른 실시예에 따라 글로벌 프레임 채널간 위상차이 값(global frame IPD)가 이용되는 개념을 나타내는 개념도이다.
도 14는 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 15 내지 도 17은 본 발명의 또다른 실시예에 따른 신호 처리 장치를 나타내는 블록도이다.
도 18은 본 발명의 또다른 실시예에 따른 IPD 코딩 플래그 획득부, IPD 모드 플래그 획득부, IPD 값 획득부 및 업믹싱부가 구현된 제품의 개략적인 구성을 보여주는 것이다.
도 19a 및 도 19b 는 본 발명의 또다른 실시예에 따른 IPD 코딩 플래그 획득부, IPD 모드 플래그 획득부, IPD 값 획득부 및 업믹싱부가 구현된 제품들의 관계를 보여주는 것이다.
도 20은 본 발명의 또다른 일실시예에 따른 IPD 코딩 플래그 획득부, IPD 모드 플래그 획득부, IPD 값 획득부 및 업믹싱부가 구현된 방송신호 디코딩 장치의 개략적인 구성을 보여주는 것이다.

Claims (10)

  1. 복수채널 신호로부터 생성된 다운믹스 신호 및 상기 다운믹스 신호를 업믹싱하기 위하여 상기 복수채널 신호의 속성을 나타내는 공간정보를 수신하는 단계;
    상기 공간정보의 헤더로부터 채널간 위상차이 값이 상기 공간정보에서 이용되는지 여부를 나타내는 채널간 위상차이 코딩 플래그를 획득하는 단계;
    상기 채널간 위상차이 코딩 플래그에 기초하여, 프레임으로부터 상기 채널간 위상차이 값이 상기 프레임에서 이용되는지 여부를 나타내는 채널간 위상차이 모드 플래그를 획득하는 단계;
    상기 채널간 위상차이 모드 플래그에 기초하여, 프레임의 파라미터 타임 슬롯의 파라미터 밴드별로 상기 채널간 위상차이 값을 획득하는 단계;
    이전 파라미터 타임 슬롯의 채널간 위상차이 값을 이용하여 상기 채널간 위상차이 값을 수정함으로써 상기 채널간 위상차이 값을 스무딩하는 단계;
    상기 다운믹스 신호에 상기 스무딩된 채널간 위상차이 값을 적용하여 복수채널 신호로 업믹싱하는 단계를 포함하고,
    상기 공간정보는 상기 헤더 및 복수개의 상기 프레임들로 구획되고,
    상기 채널간 위상차이 값은 상기 복수채널 신호 중 두 채널 사이의 위상차를 나타내고,
    상기 파라미터 타임 슬롯은 채널간 위상차이 값을 포함하는 타임 슬롯을 나타내며,
    상기 파라미터 밴드는 상기 채널간 위상차이 값을 포함하는 적어도 하나 이상의 서브밴드인 것을 특징으로 하는 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 채널간 위상차이 값을 이용하여 상기 복수채널 신호 중 두 채널 사이의 각도를 나타내는 위상각도를 생성하는 단계; 및
    상기 이전 파라미터 타임 슬롯의 위상각도를 이용하여 상기 위상각도를 수정하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
  3. 제 1 항에 있어서,
    상기 스무딩된 채널간 위상차이 값 및 상기 채널간 위상차이 값을 이용하여 상기 채널간 위상차이 값이 적용되지 아니하는 타임 슬롯의 채널간 위상차이 값을 결정하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
  4. 제 1 항에 있어서,
    상기 채널간 위상차이 값은 상기 다운믹스 신호에 포함된 상기 복수채널 신호의 두 채널 사이의 레벨 차이를 나타내는 채널간 레벨차이 값과 상기 채널간 위상차이 값의 비율이 일정값 이상인 경우 수신되는 것을 특징으로 하는 신호 처리 방법.
  5. 복수채널 신호로부터 생성된 다운믹스 신호 및 상기 다운믹스 신호를 업믹싱하기 위하여 상기 복수채널 신호의 속성을 나타내는 공간정보를 수신하는 신호 수신부;
    상기 공간정보의 헤더로부터 채널간 위상차이 값이 상기 공간정보에서 이용되는지 여부를 나타내는 채널간 위상차이 코딩 플래그를 획득하는 채널간 위상차이 코딩 플래그 획득부;
    상기 채널간 위상차이 코딩 플래그에 기초하여, 상기 공간정보의 프레임으로부터 상기 채널간 위상차이 값이 상기 프레임에서 이용되는지 여부를 나타내는 채널간 위상차이 모드 플래그를 획득하는 위상차이 모드 플래그 획득부;
    상기 채널간 위상차이 모드 플래그에 기초하여, 프레임의 파라미터 타임 슬롯의 파라미터 밴드별로 상기 채널간 위상차이 값을 획득하는 채널간 위상차이 값 획득부;
    이전 파라미터 타임 슬롯의 채널간 위상차이 값을 이용하여 상기 채널간 위상차이 값을 수정함으로써 상기 채널간 위상차이 값을 스무딩하는 채널간 위상차이 값 스무딩부; 및
    상기 다운믹스 신호에 상기 채널간 위상차이 값을 적용하여 복수채널 신호를 생성하는 업믹싱부를 포함하고,
    상기 공간정보는 상기 헤더 및 복수개의 상기 프레임들로 구획되고, 상기 채널간 위상차이 값은 상기 복수채널 신호 중 두 채널 사이의 위상차를 나타내며, 상기 파라미터 타임 슬롯은 동일한 채널간 위상차이 값이 적용되는 슬롯을 나타내고, 상기 파라미터 밴드는 상기 채널간 위상차이 값을 포함하는 적어도 하나 이상의 주파수 도메인상의 서브밴드인 것을 특징으로 하는 신호 처리 장치.
  6. 제 5 항에 있어서, 상기 채널간 위상차이 값 스무딩부는.
    상기 채널간 위상차이 값을 이용하여 상기 복수채널 신호 중 두 채널 사이의 각도를 나타내는 위상각도를 생성하는 위상각도 생성부; 및
    상기 이전 파라미터 타임 슬롯의 위상각도를 이용하여 상기 위상각도를 수정하는 위상각도 수정부를 포함하는 것을 특징으로 하는 신호 처리 장치.
  7. 제 5 항에 있어서,
    상기 스무딩된 채널간 위상차이 값 및 상기 채널간 위상차이 값을 이용하여 상기 채널간 위상차이 값이 적용되지 아니하는 타임 슬롯의 채널간 위상차이 값을 결정하는 채널간 위상차이 값 보간부를 더 포함하는 것을 특징으로 하는 신호 처리 장치.
  8. 제 5 항에 있어서,
    상기 채널간 위상차이 값은 상기 다운믹스 신호에 포함된 상기 복수채널 신호의 두 채널 사이의 레벨 차이를 나타내는 채널간 레벨차이 값과 상기 채널간 위상차이 값의 비율이 일정값 이상인 경우 수신되는 것을 특징으로 하는 신호 처리 장치.
  9. 복수채널 신호를 다운믹싱하여 다운믹스 신호를 생성하는 단계; 및
    상기 복수채널 신호의 속성을 나타내고 상기 다운믹스 신호를 업믹싱하기 위한 공간정보를 생성하는 단계를 포함하고,
    상기 공간정보를 생성하는 단계는,
    상기 복수채널 신호의 두 채널 사이의 위상 차이를 나타내는 채널간 위상차이 정보를 측정하는 단계;
    상기 복수채널 신호의 두 채널 사이의 레벨 차이를 나타내는 채널간 레벨차이 정보를 측정하는 단계;
    상기 채널간 레벨차이 값과 상기 채널간 위상차이 값의 비율이 일정값 이상인 경우 상기 채널간 위상차이 값이 상기 공간정보에서 이용됨을 나타내는 채널간 위상차이 코딩 플래그를 생성하는 단계;
    상기 채널간 위상차이 값이 프레임에서 이용됨을 나타내는 프레임의 채널간 위상차이 모드 플래그를 생성하는 단계;
    상기 채널간 위상차이 값 및 상기 채널간 위상차이 모드 플래그는 상기 공간정보의 프레임에 포함시키고, 상기 채널간 위상차이 코딩 플래그는 상기 공간정보의 헤더에 포함시키는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  10. 복수채널 신호를 다운믹싱하여 다운믹스 신호를 생성하는 다운믹싱부; 및
    상기 복수채널 신호의 속성을 나타내고 상기 다운믹스 신호를 업믹싱하기 위 한 공간정보를 생성하는 공간정보 생성부를 포함하고,
    상기 공간정보 생성부는,
    상기 복수채널 신호의 두 채널 사이의 위상 차이를 나타내는 채널간 위상차이 정보를 측정하는 채널간 위상차이 값 측정부;
    상기 복수채널 신호의 두 채널 사이의 레벨 차이를 나타내는 채널간 레벨차이 정보를 측정하는 채널간 레벨차이 값 측정부;
    상기 채널간 레벨차이 값과 상기 채널간 위상차이 값의 비율이 일정값 이상인 경우 상기 채널간 위상차이 값을 이용하기로 결정하는 정보 결정부;
    상기 채널간 위상차이 값이 상기 공간정보에서 이용됨을 나타내는 채널간 위상차이 코딩 플래그를 생성하는 채널간 위상차이 코딩 플래그 생성부; 및
    상기 채널간 위상차이 값이 프레임에서 이용됨을 나타내는 프레임의 채널간 위상차이 모드 플래그를 생성하는 채널간 위상차이 모드 플래그 생성부를 포함하고,
    상기 채널간 위상차이 값 및 상기 채널간 위상차이 모드 플래그는 상 기 공간정보의 프레임에 포함되고, 상기 채널간 위상차이 코딩 플래그는 상 기 공간정보의 헤더에 포함되는 것을 특징으로 하는 신호 처리 장치.
KR1020090090518A 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치 KR101108061B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
PCT/KR2009/005497 WO2010036059A2 (en) 2008-09-25 2009-09-25 A method and an apparatus for processing a signal
JP2011528941A JP5426680B2 (ja) 2008-09-25 2009-09-25 信号処理方法及び装置
EP09012229.2A EP2169666B1 (en) 2008-09-25 2009-09-25 A method and an apparatus for processing a signal
CN200980137978XA CN102165520B (zh) 2008-09-25 2009-09-25 处理信号的方法和装置
US12/567,355 US8346379B2 (en) 2008-09-25 2009-09-25 Method and an apparatus for processing a signal
ES09012229.2T ES2547232T3 (es) 2008-09-25 2009-09-25 Método y aparato para procesar una señal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10026208P 2008-09-25 2008-09-25
US61/100,262 2008-09-25

Publications (2)

Publication Number Publication Date
KR20100035122A KR20100035122A (ko) 2010-04-02
KR101108061B1 true KR101108061B1 (ko) 2012-01-25

Family

ID=42213076

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020090090515A KR101108060B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
KR1020090090516A KR20100035121A (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
KR1020090090518A KR101108061B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020090090515A KR101108060B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
KR1020090090516A KR20100035121A (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치

Country Status (4)

Country Link
JP (2) JP5480274B2 (ko)
KR (3) KR101108060B1 (ko)
CN (2) CN102165520B (ko)
ES (1) ES2547232T3 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2452569T3 (es) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
KR101742136B1 (ko) 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
JP5977434B2 (ja) * 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
EP2830049A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
KR101805327B1 (ko) * 2013-10-21 2017-12-05 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN111819863A (zh) * 2018-11-13 2020-10-23 杜比实验室特许公司 用音频信号及相关联元数据表示空间音频

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050226426A1 (en) 2002-04-22 2005-10-13 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002208869A (ja) * 2001-01-09 2002-07-26 Sony Corp マルチバンド無線信号送受信装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
JP5032977B2 (ja) * 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
DE602005022235D1 (de) * 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR101562379B1 (ko) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
KR100917845B1 (ko) * 2006-12-04 2009-09-18 한국전자통신연구원 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050226426A1 (en) 2002-04-22 2005-10-13 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HERRE, J. et al . "The Reference Model Architecture for MPEG Spatial Audio Coding" In : 118th AES Convention. 28 May 2005.

Also Published As

Publication number Publication date
CN102165520A (zh) 2011-08-24
JP2012503791A (ja) 2012-02-09
ES2547232T3 (es) 2015-10-02
JP5480274B2 (ja) 2014-04-23
CN102165520B (zh) 2012-11-28
KR20100035120A (ko) 2010-04-02
JP5426680B2 (ja) 2014-02-26
KR20100035122A (ko) 2010-04-02
CN102165519A (zh) 2011-08-24
KR101108060B1 (ko) 2012-01-25
KR20100035121A (ko) 2010-04-02
JP2012503792A (ja) 2012-02-09

Similar Documents

Publication Publication Date Title
KR101108061B1 (ko) 신호 처리 방법 및 이의 장치
US8258849B2 (en) Method and an apparatus for processing a signal
US8060042B2 (en) Method and an apparatus for processing an audio signal
KR101976757B1 (ko) 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
RU2439718C1 (ru) Способ и устройство для обработки звукового сигнала
US8346379B2 (en) Method and an apparatus for processing a signal
CN109509478B (zh) 音频处理装置
CA2705968C (en) A method and an apparatus for processing a signal
US7848931B2 (en) Audio encoder
US10818304B2 (en) Phase coherence control for harmonic signals in perceptual audio codecs
US8346380B2 (en) Method and an apparatus for processing a signal
KR20100095586A (ko) 신호 처리 방법 및 장치
KR20090122145A (ko) 신호의 처리 방법 및 장치
Quackenbush et al. Digital Audio Compression Technologies

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141224

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151224

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161214

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171214

Year of fee payment: 7