KR101842257B1 - 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 - Google Patents

신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 Download PDF

Info

Publication number
KR101842257B1
KR101842257B1 KR1020110092560A KR20110092560A KR101842257B1 KR 101842257 B1 KR101842257 B1 KR 101842257B1 KR 1020110092560 A KR1020110092560 A KR 1020110092560A KR 20110092560 A KR20110092560 A KR 20110092560A KR 101842257 B1 KR101842257 B1 KR 101842257B1
Authority
KR
South Korea
Prior art keywords
parameter
angle
signal
spatial
channel signals
Prior art date
Application number
KR1020110092560A
Other languages
English (en)
Other versions
KR20130029253A (ko
Inventor
이남숙
문한길
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020110092560A priority Critical patent/KR101842257B1/ko
Priority to US13/614,213 priority patent/US20130066639A1/en
Publication of KR20130029253A publication Critical patent/KR20130029253A/ko
Application granted granted Critical
Publication of KR101842257B1 publication Critical patent/KR101842257B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터를 생성하는 단계, 및 상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 단계를 포함하며, 다운 믹싱된 모노 신호를 원래의 채널 입력 신호들로 정확하게 복원할 수하는 신호 처리 방법이 기재되어 있다.

Description

신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 {METHOD FOR SIGNAL PROCESSING, ENCODING APPARATUS THEREOF, AND DECODING APPARATUS THEREOF}
본원 발명은 다수개 채널들을 다운 믹싱하는 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치에 관한 것이다.
구체적으로, n 개의 채널 신호들을 하나의 모노 신호로 다운 믹싱하는 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치에 관한 것이다.
다 채널 입출력이 가능한 엔코딩 장치 및 디코딩 장치는, 소정 코덱을 사용하여 음성 또는 음악 등의 오디오 신호를 엔코딩 및 디코딩하고, 디코딩된 신호를 송수신한다. 오디오 코덱에 있어서, 입출력 채널이 하나이면 모노, 두 개이면 스테레오, 세 개 이상이면 멀티채널이라 한다.
멀티채널 코덱(codec)에 따라 동작하는 엔코딩 장치는 n 개의 채널 신호들을 m 개의 채널 신호들로 다운 믹싱한다. 그리고, 다운 믹싱 시 공간 파라미터(spartial parameter)를 추출한다. 엔코딩 장치는 다운 믹싱된 신호 및 공간 파라미터를 엔코딩 하고, 대응되는 전송 스트림(TS: trasfer stream)을 디코딩 장치로 전송한다.
다운 믹싱의 경우, 출력되는 채널의 개수를 입력되는 채널들의 개수에 비하여 감소시키기 위해서, R-OTT(reverse one to two) 또는 R-TTT(reverse two to three) 변환을 수행한다. 여기서, R-OTT는 2개의 입력 신호를 입력받아 하나의 신호를 출력하는 변환을 뜻하고, R-TTT는 3개의 입력 신호를 입력받아 2개의 신호로 출력하는 변환을 뜻한다.
도 1은 멀티 채널 신호들을 다운 믹싱하는 엔코딩 장치를 설명하기 위한 도면이다.
도 1을 참조하면, 엔코딩 장치(100)는 다수개의 R-OTT 변환부들(R-OTT1 내지 R-OTT7)을 포함한다. 다수개의 R-OTT 변환부들은 멀티 채널인 다수개의 입력 신호(ch1 내지 ch8)들을 입력받고, R-OTT 변환을 이용한 다운 믹싱을 수행하여 최종적으로 하나의 모노 신호(M)를 생성한다.
도시된 바와 같이, 2n 개의 입력 신호들은 n 개의 R-OTT 변환부(R-OTT1, R-OTT2, R-OTT3, R-OTT4)로 입력된다. 각각의 R-OTT 변환부(예를 들어, R-OTT1)는 2개의 입력 신호를 다운 믹싱하여 1차 모노 신호(예를 들어, ch11)를 생성하고, 입력된 신호들 간의 상관관계를 나타내는 공간 파라미터(예를 들어, P1)를 생성한다.
그리고, n 개의 R-OTT 변환부(R-OTT1, R-OTT2, R-OTT3, R-OTT4)에서 각각 출력되는 n 개의 1차 모노 신호들(ch11, ch12, ch13, ch14)들은 다시 n/2 개의 R-OTT 변환부(R-OTT5, R-OTT6)로 입력된다. 각각의 R-OTT 변환부(예를 들어, R-OTT5)들은 1차 모노 신호들(예를 들어, ch11, ch12)을 다운 믹싱하여 2차 모노 신호(예를 들어, ch21)를 생성하고, 입력된 신호들 간의 상관관계를 나타내는 공간 파라미터(예를 들어, P11)를 생성한다.
그리고, 최종적으로 R-OTT 변환부(R-OTT7)는 2차 모노 신호들(ch21, ch22)을 다운 믹싱하여 최종 다운 믹싱 신호(M)를 생성하고, 대응되는 공간 파라미터(P21)를 생성한다.
R-OTT 변환된 신호를 1회 복원할 때마다, 디코딩 오차(error)가 발생한다. 전술한 바와 같이, 8개의 입력 신호를 최종 다운 믹싱 신호(M)로 다운 믹싱하려면, 3 단계의 R-OTT 변환을 수행하여야 한다. 따라서, 3 단계로 R-OTT 변환된 신호를 복원할 경우, 디코딩 오차(error)가 3회에 걸쳐서 누적되게 된다. 최종 다운 믹싱 신호(M) 및 공간 파라미터들(P1, P2, P3, P4, P11, P12, P21)을 이용하여 원래의 입력 신호들(ch1 내지 ch8)을 복원할 때, 디코딩 장치는 전술한 바와 같이 오차가 누적되면 원래의 입력 신호들(ch1 내지 ch8)과 동일한 형태로 복원할 수 없다. 구체적으로, 복원된 신호들과 원래의 입력 신호들(ch1 내지 ch8) 간에는 누적된 오차에 비례하여 신호 크기 및 위상의 차이가 발생하게 된다.
전술한 바와 같이, 멀티 채널 신호들을 다단계의 R-OTT 변환 또는 R-TTT 변환을 이용하여 다운 믹싱할 경우, 디코딩 오차로 인하여 복원된 신호의 품질이 열화되게 된다.
따라서, 이러한 디코딩 시 발생하는 신호 품질 열화를 방지할 수 있는 방법 및 장치를 제공할 필요가 있다.
본원 발명은 디코딩 시 발생하는 신호 품질의 저하를 방지할 수 있는 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치의 제공을 목적으로 한다.
구체적으로, 본원 발명은 n 개의 채널 입력 신호들을 1개의 모노 신호로 다운 믹싱할 경우, 모노 신호를 원래의 채널 입력 신호들로 정확하게 복원할 수 있도록 하는 공간 파라미터를 생성 또는 처리할 수 있는 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치의 제공을 목적으로 한다.
본 발명의 일 실시예에 따른 신호 처리 방법은 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터를 생성하는 단계, 및 상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 단계를 포함한다.
또한, 상기 공간 파라미터를 생성하는 단계는 상기 나머지 채널 신호들을 합산하여 합산 신호를 생성하는 단계, 및 상기 합산 신호와 상기 기준 채널 신호 간의 상관관계를 이용하여 상기 공간 파라미터를 생성하는 단계를 포함할 수 있다.
또한, 상기 공간 파라미터를 생성하는 단계는 상기 제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 상기 공간 파라미터를 n 개 생성하는 단계를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 신호 처리 방법은 상기 디코딩 장치가 엔코딩된 상기 n 개의 공간 파라미터들 및 엔코딩된 상기 모노 신호를 수신하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 신호 처리 방법은 상기 n 개의 공간 파라미터들과 상기 모노 신호를 이용하여, 상기 제1 내지 제n 채널 신호들을 복원하는 단계를 더 포함할 수 있다.
또한, 상기 공간 파라미터는 상기 기준 채널 신호와 상기 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 소정 각도 값으로 나타내는 앵글 파라미터를 포함할 수 있다.
또한, 상기 공간 파라미터를 생성하는 단계는 제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 상기 기준 채널 신호인 제1 내지 제 n 채널 신호들 각각과 상기 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 나타내는 제1 내지 제 n 앵글 파라미터들을 생성하는 단계를 포함할 수 있다.
또한, 상기 n 개의 앵글 파라미터들의 총 합은 소정 값으로 수렴할 수 있다. 이 경우, 상기 공간 파라미터를 생성하는 단계는 상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 상기 제 k 앵글 파라미터를 산출하는데 이용되는 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 생성하는 단계를 포함할 수 있다.
또한, 상기 공간 파라미터를 생성하는 단계는 상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터의 값을 예측하는 단계, 상기 예측된 제 k 앵글 파라미터의 값과 원래의 제 k 앵글 파라미터의 값을 비교하는 단계, 및 상기 예측된 제 k 앵글 파라미터의 값과 상기 원래의 제 k 앵글 파라미터의 값의 차이 값을 상기 제 k 앵글 잔여 파라미터로 생성하는 단계를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 신호 처리 방법은 상기 제1 내지 제 n 앵글 파라미터들 중 상기 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 상기 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 상기 디코딩 장치가 수신하는 단계, 및 수신된 상기 공간 파라미터 및 상기 소정 값을 이용하여, 상기 제 k 앵글 파라미터를 복원하는 단계를 더 포함할 수 있다.
또한, 상기 제 k 앵글 파라미터를 복원하는 단계는 상기 소정 값에서 상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터 값들을 빼고, 상기 뺀 값에서 상기 제 k 앵글 잔여 파라미터의 값을 보상한 값을 상기 제 k 앵글 파라미터로 생성하는 단계를 포함할 수 있다.
본 발명의 다른 실시예에 따른 신호 처리 방법은 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 모노 신호 간의 상관관계를 이용하여 공간 파라미터를 생성하는 단계, 및 상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 단계를 포함한다.
본 발명의 일 실시예에 따른 엔코딩 장치는 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터를 생성하는 다운 믹싱 부, 및 상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 엔코더를 포함한다.
본 발명의 일 실시예에 디코딩 장치는 엔코딩 장치로부터 전송 스트림을 수신하고, 엔코딩된 공간 파라미터를 분리하는 역다중화부, 상기 공간 파라미터를 디코딩하는 공간 파라미터 디코딩 부, 및 제1 내지 제n 채널 신호들을 다운 믹싱 및 엔코딩하여 생성된 모노 신호를 디코딩하고, 상기 디코딩된 모노 신호 및 상기 디코딩된 공간 파라미터를 이용하여 상기 제1 내지 제 n 채널 신호들을 복원하는 업 믹싱 부를 포함한다. 그리고, 상기 공간 파라미터는 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들 간의 제1 공간 파라미터 및 상기 기준 채널 신호와 상기 모노 신호 간의 제2 공간 파라미터 중 적어도 하나를 포함한다.
도 1은 멀티 채널 신호들을 다운 믹싱하는 엔코딩 장치를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 엔코딩 장치를 나타내는 블록도이다.
도 3은 본 발명의 일 실시예에 따른 신호 처리 방법을 나타내는 플로우차트이다.
도 4는 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 플로우차트이다.
도 5는 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록도이다.
도 6은 도 3의 310 단계 동작을 설명하기 위한 일 도면이다.
도 7은 도 3의 310 단계 동작을 설명하기 위한 다른 도면이다.
도 8은 원래의 채널 신호 및 복원된 채널 신호를 나타내는 도면이다.
도 9는 도 3의 310 단계를 설명하기 위한 다른 도면이다.
도 10은 앵글 파라미터들의 총 합을 나타내는 그래프이다.
도 11은 앵글 파라미터들의 산출을 설명하기 위한 도면이다.
도 12는 제1 내지 제n 앵글 파라미터들을 전송하기 위해 필요한 데이터 영역들을 나타내는 도면이다.
이하에서는, 첨부된 도면을 참조하여 본 발명에 따른 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치를 상세히 설명한다.
공간 파라미터는 다운 믹싱된 신호를 원래의 입력 채널 신호들로 복원하는 필요한 정보를 가진다. 구체적으로, 공간 파라미터는 입력 채널 신호들 간의 상관관계를 이용하여 생성되는 파라미터로, 크게 입력 채널 신호들 간의 신호 레벨 차이를 나타내는 파라미터 및 입력 채널 신호들 간의 상관관계를 나타내는 파라미터를 포함할 수 있다.
입력 채널 신호들 간의 신호 레벨 차이를 나타내는 파라미터는 이하에서 제1 파라미터라 칭한다. 구체적으로, 제1 파라미터는 입력 채널 신호들의 상대적 크기를 표현하는 파라미터이다. 제1 파라미터는 채널 레벨 차이(CLD:channel level difference) 파라미터를 포함할 수 있다.
입력 채널 신호들 간의 상관관계, 예를 들어, 유사도,를 나타내는 파라미터는 이하에서 제2 파라미터라 칭한다. 구체적으로, 제 2 파라미터는 인터 채널 상관관계(ICC: Inter Channel Correlation) 파라미터, 전체 위상 차이 파라미터(OPD: Overall Phase Difference), 및 인터 채널 위상 차이 파라미터(IPD: Inter Phase Difference) 중 적어도 하나를 포함할 수 있다.
도 2는 본 발명의 일 실시예에 따른 엔코딩 장치를 나타내는 블록도이다.
도 2를 참조하면, 본 발명이 일 실시예에 따른 엔코딩 장치(200)는 다운 믹싱 부(210) 및 엔코더(220)를 포함한다.
엔코딩 장치(200)는 제1 내지 제n 채널 신호들(ch1 내지 chn)을 모노 신호(DM)로 다운 믹싱(downmixing) 및 엔코딩(encoding) 한다.
다운 믹싱 부(210)는 멀티 채널 신호들인 제1 내지 제 n 채널 신호들(ch1 내지 chn)을 입력받고, 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터를 생성할 수 있다. 이하에서는, 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 기준 채널 신호를 제외한 나머지 채널 신호들을 합한 신호를 제1 합산 신호라 한다. 그리고, 기준 채널 신호와 제1 합산 신호 간의 공간 파라미터를 제1 공간 파라미터라 한다. 즉, 다운 믹싱 부(210)는 기준 채널 신호와 제1 합산 신호 간의 공간 파라미터를 생성할 수 있다.
또한, 다운 믹싱 부(210)는 다운 믹싱 부(210)는 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들(ch1 내지 chn) 간의 공간 파라미터를 생성할 수 있다. 이하에서는, 제1 내지 제 n 채널 신호들을 합한 신호를 제2 합산 신호라 한다. 그리고, 기준 채널 신호와 제2 합산 신호 간의 공간 파라미터를 제2 공간 파라미터라 한다. 즉, 다운 믹싱 부(210)는 기준 채널 신호와 제2 합산 신호 간의 공간 파라미터를 생성할 수 있다.
다운 믹싱 부(210)에서 생성된 공간 파라미터는 각각 전술한 입력 채널 신호들의 상대적 크기를 표현하는 파라미터인 제1 파라미터 및 입력 채널 신호들 간의 상관관계를 나타내는 파라미터인 제2 파라미터 중 적어도 하나를 포함할 수 있다.
다운 믹싱 부(210)의 공간 파라미터 생성 동작은 이하에서 도 3 내지 도 6을 참조하여 상세히 설명한다.
또한, 다운 믹싱 부(210)는 제1 내지 제 n 채널 신호들(ch1 내지 chn)을 다운 믹싱하여 모노 신호(DM)를 생성한다.
엔코더(220)는 다운 믹싱 부(210)에서 생성된 공간 파라미터(SP)를 엔코딩하여 디코딩 장치(미도시)로 전송한다. 또한, 다운 믹싱 부(210)에서 생성된 모노 신호(DM)를 엔코딩한다.
구체적으로, 엔코더(220)는 다운 믹싱 부(210)에서 생성된 공간 파라미터(SP) 및 모노 신호(DM)를 엔코딩하고, 전송 스트림(TS)으로 변환한다. 그리고, 변환된 전송 스트림(TS)를 디코딩 장치(미도시)로 전송한다.
본 발명의 일 실시예에 따른 엔코딩 장치(200)의 상세 동작 구성은 이하에서 도 3 및 도 4를 참조하여 설명할 본 발명의 일 및 다른 실시예에 따른 신호 처리 방법(300, 400)의 각 단계 동작 구성과 동일하다.
도 3은 본 발명의 일 실시예에 따른 신호 처리 방법을 나타내는 플로우차트이다. 본 발명의 일 실시예에 따른 신호 처리 방법(300)은 도 2에서 설명한 본 발명의 일 실시예에 따른 엔코딩 장치(200)에서 구현될 수 있다. 또한, 신호 처리 방법(300)의 각 단계 구성은 엔코딩 장치(200)의 동작 구성과 동일하므로, 도 2에서와 중복되는 설명은 생략한다.
도 3을 참조하면, 신호 처리 방법(300)은 멀티 채널 신호들인 제1 내지 제 n 채널 신호들(ch1 내지 chn)을 입력받고, 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터인 제1 공간 파라미터를 생성할 수 있다(310 단계). 또한, 310 단계에서는 제1 공간 파라미터 대신에 전술한 제2 공간 파라미터를 생성할 수 있다. 또한, 310 단계는 제1 내지 제 n 채널 신호들(ch1 내지 chn)을 다운 믹싱하여 모노 신호(DM)를 생성하는 단계를 더 포함할 수 있다.
310 단계의 동작은 다운 믹싱 부(210)에서 수행될 수 있다.
310 단계에서 생성된 공간 파라미터(SP)를 엔코딩하여 디코딩 장치(미도시)로 전송한다(320 단계). 구체적으로, 320 단계에서 전송되는 공간 파라미터(SP)는 전술한 제1 공간 파라미터 및 제2 공간 파라미터 중 적어도 하나를 포함할 수 있다. 구체적으로, 공간 파라미터(SP) 및 모노 신호(DM)를 엔코딩하고, 전송 스트림(TS)으로 변환하며, 변환된 전송 스트림(TS)을 디코딩 장치(미도시)로 전송할 수 있다.
320 단계의 동작은 엔코더(220)에서 수행될 수 있다.
도 4는 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 플로우차트이다. 신호 처리 방법(400)에 있어서, 430 단계 및 440 단계는 각각 신호 처리 방법(300)의 310 단계 및 320 단계와 동일 대응되므로, 도 3에서와 중복되는 설명은 생략한다. 본 발명의 다른 실시예에 따른 신호 처리 방법(400)은 도 3에서 설명한 신호 처리 방법(300)에 비하여, 410, 420, 450 및 460 단계 중 적어도 하나의 단계를 더 포함할 수 있다.
도 4를 참조하면, 본 발명의 다른 실시예에 따른 신호 처리 방법(400)은 멀티 채널 신호인 n 개의 채널 신호들(ch1 내지 chn)을 다운 믹싱한다(410 단계). 구체적으로, n 개의 채널 신호들(ch1 내지 chn)은 하나의 모노 신호(DM)로 다운 믹싱될 수 있다. 410 단계의 동작은 다운 믹싱 부(210)에서 수행될 수 있다.
입력된 n 개의 채널 신호들(ch1 내지 chn) 중 (n-1)개의 채널 신호들을 합산하거나 또는 입력된 n 개의 채널 신호들(ch1 내지 chn)을 합산한다(420 단계). 구체적으로, 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 기준 채널 신호를 제외한 나머지 채널 신호들을 합산할 수 있으며, 합산된 신호는 전술한 제1 합산 신호가 된다. 또는, 제1 내지 제 n 채널 신호들(ch1 내지 chn) 전체를 합산할 수 있으며, 합산된 신호는 전술한 제2 합산 신호가 된다.
그리고, 420 단계에서 생성된 신호인 제1 합산 신호와 기준 채널 신호 간의 상관관계를 이용하여 전술한 제1 공간 파라미터를 생성할 수 있다(430 단계). 또는, 제1 공간 파라미터는 생성하지 않고, 420 단계에서 생성된 신호인 제2 합산 신호와 기준 채널 신호 간의 상관관계를 이용하여 전술한 제2 공간 파라미터를 생성할 수도 있다(430 단계).
또한,기준 채널 신호는 제1 내지 제 n 채널 신호(ch1 내지 chn) 각각이 될 수 있다. 따라서, 기준 채널 신호는 모두 n 개가 될 수 있으며, 기준 채널 신호에 대응하는 공간 파라미터 또한 n 개가 생성될 수 있다.
따라서, 430 단계는 제1 내지 제 n 채널 신호들(ch1 내지 chn) 각각을 기준 채널 신호로 하여, 공간 파라미터를 n 개 생성하는 단계를 더 포함할 수 있다.
420 단계 및 430 단계의 동작은 다운 믹싱 부(210)에서 수행될 수 있으며, 이하에서 도 6 및 도 7을 참조하여 상세히 설명한다.
430 단계에서 생성된 공간 파라미터(SP)를 엔코딩하여 디코딩 장치(미도시)로 전송한다(440 단계). 또한, 410 단계에서 생성된 모노 신호(DM)를 엔코딩하여 디코딩 장치(미도시)로 전송한다. 구체적으로, 엔코딩된 공간 파라미터 및 엔코딩된 모노 신호를 전송 스트림(TS)에 포함시켜 디코딩 장치(미도시)로 전송할 수 있다. 전송 스트림(TS)에 포함되는 공간 파라미터는 전술한 제1 내지 제n 공간 파라미터들을 포함하는 공간 파라미터 셋(set)을 의미한다.
440 단계의 동작은 엔코더(220)에서 수행될 수 있다.
450 및 460 단계의 동작은 이하에서 도 5를 참조하여 상세히 설명한다.
도 5는 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록도이다.
디코딩 장치(500)는 역다중화부(510), 공간 파라미터 디코딩 부(520) 및 업 믹싱 부(530)를 포함한다.
역다중화부(510)는 엔코딩 장치(200)로부터 엔코딩된 공간 파라미터(EN_SP) 및 엔코딩된 모노 신호(EN_DM)를 포함하는 전송 스트림(TS)을 수신한다(450 단계).
구체적으로, 역다중화부(510)는 전송 스트림(TS)에서 엔코딩된 공간 파라미터(EN_SP)를 분리하여 공간 파라미터 디코딩 부(520)로 출력한다. 또한, 역다중화부(510)는 전송 스트림(TS)에서 엔코딩된 모노 신호(EN_DM)를 분리하여 업 믹싱 부(530)로 출력한다.
공간 파라미터 디코딩 부(520)는 역다중화부(510)에서 출력되는 엔코딩된 공간 파라미터(EN_SP)를 디코딩한다. 디코딩된 공간 파라미터(DE_SP)는 업 믹싱 부(530)로 전송된다. 또한, 디코딩된 공간 파라미터(DE_SP)는 전술한 n 개의 제1 공간 파라미터 및 n 개의 제2 공간 파라미터 중 적어도 하나를 포함할 수 있다.
업 믹싱 부(530)는 제1 내지 제n 채널 신호들(ch1 내지 chn)을 다운 믹싱 및 엔코딩하여 생성된 모노 신호(EN_DM)를 디코딩하고, 디코딩된 모노 신호 및 디코딩된 공간 파라미터를 이용하여 제1 내지 제 n 채널 신호들(ch1 내지 chn)을 복원한다(460 단계). 즉, 디코딩된 n 개의 공간 파라미터를 이용하여, 디코딩된 모노 신호를 업믹싱(up-mixing)하여 제1 내지 제 n 채널 신호들을 생성한다.
도 6은 도 3의 310 단계 동작을 설명하기 위한 일 도면이다. 또한, 도 6은 도 3의 310 단계에 대응되는 도 4의 420 및 430 단계를 설명하기 위한 일 도면이다. 이하에서는 도 6을 참조하여 제1 합산 신호 및 제1 공간 파라미터를 생성하는 동작을 상세히 설명한다. 도 6에서는 멀티 채널 신호가 제1 내지 제3 채널 신호들(ch1, ch2, ch3)을 포함하는 경우를 예로 들어 도시하였다. 또한, 도 6에서 신호의 합산을 신호의 백터 합산을 예로 들어 도시하였다. 신호의 합산은 전술한 다운 믹싱을 뜻하며, 백터 합 방법 이외에도 다양한 다운 믹싱 방법이 존재할 수 있다.
도 6의 (a), 도 6의 (b) 및 도 6의 (c)는 각각 기준 채널 신호가 제1 채널 신호(ch1), 제2 채널 신호(ch2), 및 제3 채널 신호(ch3)인 경우를 도시한다.
도 6의 (a)를 참조하면, 기준 채널 신호가 제1 채널 신호(ch1)인 경우, 다운 믹싱 부(210)는 기준 채널 신호를 제외한 제2 및 제3 채널 신호들(ch2, ch3)을 합산(ch2 + ch3)하여 합산 신호(610)를 생성한다. 그리고, 기준 채널 신호인 제1 채널 신호(ch1)와 합산 신호(610) 간의 상관관계(ch1, ch2 + ch3)를 이용하여 공간 파라미터를 생성한다. 전술한 바와 같이, 공간 파라미터는 기준 채널 신호와 합산 신호 간의 상관관계를 나타내는 정보 및 기준 채널 신호와 합산 신호의 상대적 신호 크기를 나타내는 정보를 가진다.
도 6의 (b)를 참조하면, 기준 채널 신호가 제2 채널 신호(ch2)인 경우, 다운 믹싱 부(210)는 기준 채널 신호를 제외한 제1 및 제3 채널 신호들(ch1, ch3)을 합산(ch1 + ch3)하여 합산 신호(620)를 생성한다. 그리고, 기준 채널 신호인 제2 채널 신호(ch2)와 합산 신호(620) 간의 상관관계(ch2, ch1 + ch3)를 이용하여 공간 파라미터를 생성한다.
도 6의 (c)를 참조하면, 기준 채널 신호가 제3 채널 신호(ch3)인 경우, 다운 믹싱 부(210)는 기준 채널 신호를 제외한 제1 및 제2 채널 신호들(ch1, ch2)을 합산(ch1 + ch2)하여 합산 신호(630)를 생성한다. 그리고, 기준 채널 신호인 제3 채널 신호(ch3)와 합산 신호(630) 간의 상관관계(ch3, ch1 + ch3)를 이용하여 공간 파라미터를 생성한다.
전술한 바와 같이, 멀티 채널 신호가 3개의 채널 신호를 포함할 경우, 기준 채널 신호는 3개가 되며, 3개의 공간 파라미터가 생성될 수 있다. 생성된 공간 파라미터는 엔코더(220)에서 엔코딩되어 디코딩 장치(500)로 전송된다.
제1 내지 제3 채널 신호들(ch1, ch2, ch3)을 다운 믹싱한 모노 신호(DM)는 제1 내지 제3 채널 신호들(ch1, ch2, ch3)의 합산 신호와 동일하며, DM=ch1 + ch2 + ch 3 과 같이 표현할 수 있다. 따라서, ch1 = DM - (ch2 + ch 3)의 관계가 성립한다.
디코딩 장치(500)는 도 6에 설명한 공간 파라미터인 제1 공간 파라미터를 수신 및 디코딩한다. 그리고, 디코딩된 모노 신호와 디코딩된 공간 파라미터를 이용하여 원래의 채널 신호들을 복원한다. 전술한 바와 같이, ch1 = DM - (ch2 + ch 3)의 관계가 성립하고, 도 6의 (a)에서 생성된 공간 파라미터는 신호들(ch1, ch2 + ch3)의 상대적 크기를 나타내는 파라미터 및 신호들(ch1, ch2 + ch3)의 유사도를 표현하는 파라미터를 포함할 수 있으므로, 도 6의 (a)에서 생성된 공간 파라미터 및 모노 신호(DM)를 이용하면 ch1 과 ch2+ch3 신호를 복원할 수 있다. 동일한 방법으로, 도 6의 (b) 및 도 6의 (c)에서 생성된 공간 파라미터들을 이용하면, ch2 과 ch1+ch3 신호 및 ch3 과 ch1+ch3 신호를 복원할 수 있다. 즉, 업 믹싱 부(530)는 제1 내지 제3 채널 신호들(ch1, ch2, ch3)를 모두 복원할 수 있다.
도 7은 도 3의 310 단계 동작을 설명하기 위한 다른 도면이다. 또한, 도 7은 도 3의 310 단계에 대응되는 도 4의 420 및 430 단계를 설명하기 위한 일 도면이다. 이하에서는 도 7을 참조하여 제2 합산 신호 및 제2 공간 파라미터를 생성하는 동작을 상세히 설명한다. 도 7에서는 멀티 채널 신호가 제1 내지 제3 채널 신호들(ch1, ch2, ch3)을 포함하는 경우를 예로 들어 도시하였다. 또한, 도 7에서 신호의 합산을 신호의 백터 합산을 예로 들어 도시하였다.
도 7을 참조하면, 제2 합산 신호는 멀티 채널 신호인 제1 내지 제3 채널 신호들(ch1, ch2, ch3)을 모두 합산한 신호이므로, ch1 신호와 ch2 신호를 합산한 신호(710)에 ch3 신호를 합산한 신호(ch1+ch2+ch3)(720)가 제2 합산 신호가 된다.
제1 채널 신호(ch1)를 기준 채널 신호로 하여, 제1 채널 신호(ch1)와 제2 합산 신호(720) 간의 공간 파라미터를 생성한다. 구체적으로, 제1 채널 신호(ch1)와 제2 합산 신호(720) 간의 상관관계(ch1, ch1+ch2+ch3)를 이용하여, 전술한 제1 파라미터 및 제2 파라미터 중 적어도 하나를 포함하는 공간 파라미터를 생성할 수 있다.
그리고, 제2 채널 신호(ch2)를 기준 채널 신호로 하여, 제2 채널 신호(ch2)와 제2 합산 신호(720) 간의 상관관계(ch2, ch1+ch2+ch3)를 이용하여, 공간 파라미터를 생성한다. 또한, 제3 채널 신호(ch3)를 기준 채널 신호로 하여, 제3 채널 신호(ch3)와 제2 합산 신호(720) 간의 상관관계(ch2, ch1+ch2+ch3)를 이용하여, 공간 파라미터를 생성한다.
디코딩 장치(500)는 도 7에 설명한 공간 파라미터인 제1 공간 파라미터를 수신 및 디코딩한다. 그리고, 디코딩된 모노 신호와 디코딩된 공간 파라미터를 이용하여 원래의 채널 신호들을 복원한다. 여기서, 디코딩된 모노 신호는 멀티 채널 신호들의 합산 신호(ch1+ch2+ch3)와 대응된다.
따라서, 제1 채널 신호(ch1)와 제2 합산 신호(720) 간의 상관관계(ch1, ch1+ch2+ch3)를 이용하여 생성된 공간 파라미터 및 디코딩된 모노 신호를 이용하면, 제1 채널 신호(ch1)를 복원할 수 있다. 이와 유사하게, 제2 채널 신호(ch2)와 제2 합산 신호(720) 간의 상관관계(ch2, ch1+ch2+ch3)를 이용하여 생성된 공간 파라미터를 이용하면, 제2 채널 신호(ch2)를 복원할 수 있다. 또한, 제3 채널 신호(ch3)와 제2 합산 신호(720) 간의 상관관계(ch2, ch1+ch2+ch3)를 이용하여 생성된 공간 파라미터를 이용하면, 제3 채널 신호(ch3)를 복원할 수 있다.
도 8은 원래의 채널 신호 및 복원된 채널 신호를 나타내는 도면이다.
도 8의 (a)는 엔코딩 장치(200)가 입력받은 원래의 채널 신호의 일 예를 도시한다. x 축은 시간을 나타내며, y축은 채널 신호의 신호 크기(magnitude)를 나타낸다.
도 8의 (b)는 도 1에서 설명한 종래의 엔코딩 장치(100)에서 생성된 모노 신호(M) 및 공간 파라미터들(P1, P2, P3, P4, P11, P12, P21)을 이용하여 복원한 일 채널 신호(이하, '종래 복원 신호')를 도시한다.
도 8의 (c)는 본 발명의 일 실시예에 따른 엔코딩 장치(200) 또는 본 발명의 일 실시예 또는 다른 실시예에 따른 신호 처리 방법(300, 400)에서 생성된 모노 신호 및 공간 파라미터들을 이용하여 복원한 일 채널 신호(이하, '본원 복원 신호')를 도시한다.
도 8의 (a)를 참조하면, 시간 구간인 t1 내지 t2 구간에서, 원래의 채널 신호(810)는 도시된 바와 같은 파형을 갖는다. 이에 비하여, 도 8의 (b)를 참조하면, t1 내지 t2 구간에서 종래 복원 신호(821)는 원래의 채널 신호(810)에 비하여 소정 구간(820)에서 신호의 손실이 발생할 것을 알 수 있다.
즉, 종래 복원 신호를 재생하면, 디코딩 오차 등으로 인한 종래 복원 신호의 신호 손실로 인하여, 음질이 저하되게 된다.
이에 비하여, 도 8의 (c)를 참조하면, 본원 복원 신호(830)는 원래의 복원 신호(810)와 거의 동일한 파형을 가진다.
따라서, 본 발명의 일 시예 또는 다른 실시예에 따른 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치는 원래의 복원 신호(810)로 더욱 정확하게 신호 복원 동작을 수행할 수 있으며, 디코딩 오차 등으로 인하여 신호의 손실 및 음질 저하를 방지할 수 있다.
도 9는 도 3의 310 단계를 설명하기 위한 다른 도면이다. 또한, 도 9는 도 3의 310 단계에 대응되는 도 4의 420 및 430 단계를 설명하기 위한 다른 도면이다.
다운 믹싱 부(210)에서 생성되는 공간 파라미터는 제1 파라미터로 앵글 파라미터를 포함할 수 있다.
구체적으로, 310 단계의 공간 파라미터를 생성하는 단계 및 430 단계의 공간 파라미터를 생성하는 단계 중 적어도 하나의 단계는 앵글 파라미터를 생성하는 단계를 포함할 수 있다.
앵글 파라미터는 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들(ch1 내지 chn) 중 기준 채널 신호를 제외한 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 소정 각도 값으로 나타내는 파라미터이다. 또한, 앵글 파라미터는 글로벌 벡터 앵글(GVA: Global Vector Angle)이라 호칭할 수 있다.
또한, 앵글 파라미터는 기준 채널 신호와 제1 합산 신호의 상대적 크기를 앵글 값으로 표현하는 파라미터이다.
또한, 다운 믹싱 부(210)는 제1 내지 제 n 채널 신호들(ch1 내지 chn) 각각을 기준 채널 신호로 하여, n 개의 제1 내지 제 n 앵글 파라미터들을 생성할 수 있다. 이하에서는, 제k 채널 신호를 기준 채널 신호로 하여 생성된 앵글 파라미터를 제k 앵글 파라미터라 한다.
도 9의 (a)를 참조하면, 엔코딩 장치(200)가 입력받는 멀티 채널 신호는 제1 내지 제 3 채널 신호들(ch1, ch2, ch3)을 포함하는 경우를 예로 들어 도시하였다.
도 9의 (b), 도 9의 (c) 및 도 9의 (d)는 각각 기준 채널 신호가 제1 채널 신호(ch1), 제2 채널 신호(ch2), 및 제3 채널 신호(ch3)인 경우를 도시한다.
도 9의 (b)를 참조하면, 다운 믹싱 부(210)는 기준 채널 신호가 제1 채널 신호(ch1)인 경우, 기준 채널 신호를 제외한 나머지 채널 신호들인 제2 및 제3 채널 신호(ch2, ch3)를 합산(ch2+ch3)하고, 합산된 신호(920)와 제1 채널 신호(ch1) 간의 앵글 파라미터인 제1 앵글 파라미터(angle 1)(922)를 구한다. 또한, 도 8에서 신호의 합산을 신호의 백터 합을 예로 들어 도시하였다.
구체적으로, 제1 앵글 파라미터(angle 1)(922)는 합산된 신호(ch2+ch3)(920)의 절대 값을 제1 채널 신호(ch1)의 절대값으로 나눈 값을 역 탄젠트(inverse tangent)하여 구할 수 있다.
도 9의 (c)를 참조하면, 제2 채널 신호(ch2)를 기준 채널 신호로 한 제2 앵글 파라미터(angle 2)(932)는 합산된 신호(ch1+ch3)(930)의 절대 값을 제2 채널 신호(ch2)의 절대값으로 나눈 값을 역 탄젠트(inverse tangent)하여 구할 수 있다.
도 9의 (d)를 참조하면, 제3 채널 신호(ch3)를 기준 채널 신호로 한 제3 앵글 파라미터(angle 3)(942)는 합산된 신호(ch2+ch3)(940)의 절대 값을 제3 채널 신호(ch3)의 절대값으로 나눈 값을 역 탄젠트(inverse tangent)하여 구할 수 있다.
도 10은 앵글 파라미터들의 총 합을 나타내는 그래프이다.
구체적으로, 제1 내지 제 n 채널 신호들 각각을 기준 채널 신호로 하여 산출된 n 개의 앵글 파라미터들의 총 합은 소정 값으로 수렴된다. 수렴되는 소정 값은 n 의 값에 따라서 달라질 수 있는 값으로, 실험적으로 최적화될 수 있다.
도 10에 있어서, x 축은 각도 값을 나타내고, y 축은 분포 확률을 나타낸다. 또한, 도시된 각도 값은 1 단위가 6 도 (degree)에 대응되며, 예를 들어, x 축의 30 값은 180 도가 된다.
도 10을 참조하면, n이 3개일 경우, 앵글 파라미터들의 총 합은 도시된 바와 같이 30 단위, 즉, 180 도 부근(1010)에서 수렴된다. 도 10의 그래프는 실험적으로 산출되었다.
예외적으로, 앵글 파라미터들의 총 합이 45 단위, 즉, 270 도 부근(1020)에서 수렴되는 경우가 있다. 소정 값이 270 도 부근(1020)에서 수렴하는 경우는, 3개의 채널 신호들이 모두 묵음이어서 각각의 앵글 파라미터가 90 도의 값을 갖는 경우이다. 상기 예외의 경우에는, 3개의 앵글 파라미터들 중 하나의 앵글 파라미터의 값을 0 으로 바꾸면, 다시 앵글 파라미터들의 총 합은 180 도로 수렴된다. 3개의 채널 신호들이 모두 묵음인 경우, 다운 믹싱된 모노 신호도 0 값을 가지며, 모노 신호를 업 믹싱 및 디코딩 하여도 0 값을 가진다. 따라서, 앵글 파라미터의 값을 0 으로 바꾸더라도 업 믹싱 및 디코딩 결과는 달라지지 않으므로, 3개의 앵글 파라미터들 중 하나의 앵글 파라미터의 값을 0 으로 바꾸어도 무관하다.
또한, 310 단계의 공간 파라미터를 생성하는 단계 및 430 단계의 공간 파라미터를 생성하는 단계 중 적어도 하나의 단계는 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 제 k 앵글 파라미터를 산출하는데 이용되는 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 생성하는 단계를 포함할 수 있다. 제 k 앵글 잔여 파라미터는 이하에서 도 11을 참조하여 상세히 설명한다.
도 11은 앵글 파라미터들의 산출을 설명하기 위한 도면이다. 도 11에서는 멀티 채널 신호가 3개의 채널 신호들(ch1, ch2, ch3)을 포함하는 경우를 예로 들어 도시하였다.
도 11을 참조하면, 제1 채널 신호(ch1)가 기준 채널 신호인 경우 제1 앵글 파라미터가 산출되어 엔코딩되며, 코딩된 제1 앵글 파라미터는 소정 비트 영역(1101)에 포함되어 디코딩 장치(500)로 전송된다. 그리고, 제2 채널 신호(ch2)가 기준 채널 신호인 경우, 제2 앵글 파라미터가 산출되어 엔코딩되며, 코딩된 제2 앵글 파라미터는 소정 비트 영역(1103)에 포함되어 디코딩 장치(500)로 전송된다.
제3 앵글 파라미터가 전술한 제 k 앵글 파라미터인 경우, 제 k 앵글 잔여 파라미터를 구하는 것을 이하에서 설명한다.
전술한 바와 같이, n 개의 앵글 파라미터들의 총 합은 소정 값으로 수렴하므로, 제 k 앵글 파라미터의 값은 상기 소정 값에서 n 개의 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들의 값을 빼면 구할 수 있다. 구체적으로, n 이 3일 경우, 세 개의 채널 신호들 모두가 묵음인 경우가 아니면, 세 개의 앵글 파라미터들의 총 합은 180 도로 수렴한다. 따라서, '제3 앵글 파라미터의 값 = 180 도 - (제1 앵글 파라미터의 값 + 제2 앵글 파라미터의 값)'이 된다. 전술한 관계식을 이용하여 제3 앵글 파라미터를 예측할 수 있다.
구체적으로, 다운 믹싱 부(210)는 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터의 값을 예측한다. 상기 예측은 전술한 관계식 및 소정 값을 이용하여 이뤄질 수 있다. 소정 비트 영역(1107)은 예측된 제 k 앵글 파라미터의 값이 포함된 데이터 영역을 나타낸다.
그리고, 다운 믹싱 부(210)는 예측된 제 k 앵글 파라미터의 값과 원래의 제 k 앵글 파라미터의 값을 비교한다. 소정 비트 영역(1105)은 도 9의 (d)에서와 같이 산출된 제3 앵글 파라미터의 값을 포함하는 데이터 영역을 나타낸다.
그리고, 다운 믹싱 부(210)는 예측된 제 k 앵글 파라미터의 값(1107)과 원래의 제 k 앵글 파라미터의 값(1105)의 차이 값을 전술한 제 k 앵글 잔여 파라미터로 생성한다. 소정 비트 영역(1111)은 제 k 앵글 잔여 파라미터의 값이 포함된 데이터 영역을 나타낸다.
엔코더(220)는 제1 내지 제 n 앵글 파라미터들 중 상기 제 k 앵글 파라미터를 제외한 앵글 파라미터들(1101 및 1103 영역에 포함되는 파라미터들) 및 상기 제 k 앵글 잔여 파라미터(1111 영역에 포함되는 파라미터)를 포함하는 공간 파라미터를 엔코딩하여 디코딩 장치(500)로 전송한다.
그에 따라서, 디코딩 장치(500)는 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 제 k 앵글 잔여 파라미터를 포함하는 공간 파라미터를 수신한다.
디코딩 장치(500)의 공간 파라미터 디코딩 부(520)는 수신된 공간 파라미터 및 소정 값을 이용하여, 제 k 앵글 파라미터를 복원한다.
구체적으로, 공간 파라미터 디코딩 부(520)는 소정 값에서 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들의 값을 빼고, 상기 뺀 값에서 제 k 앵글 잔여 파라미터의 값을 보상한 값을 제 k 앵글 파라미터로 생성할 수 있다.
도 12는 제1 내지 제n 앵글 파라미터들을 전송하기 위해 필요한 데이터 영역들을 나타내는 도면이다. 도 12에서 소정 비트 영역들(1201, 1203)은 각각 도 11의 소정 비트 영역(1101, 1103)과 동일 대응되므로, 중복되는 설명은 생략한다.
도 12를 참조하면, 소정 비트 영역(1105)은 제3 앵글 파라미터의 값이 포함된 데이터 영역을 나타낸다.
제 k 앵글 잔여 파라미터의 값의 값은 k 앵글 파라미터의 값에 비하여 작은 데이터 크기를 갖는다. 따라서, 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 제 k 앵글 잔여 파라미터를 포함하는 공간 파라미터를 디코딩 장치(500)로 전송할 경우, 엔코딩 장치(200)와 디코딩 장치(500)간에 송수신되는 데이터량을 줄일 수 있다.
즉, 도 12에서와 같이, 3개의 소정 비트 영역들(1201, 1203, 1205)을 모두 포함하는 전송 스트림(TS)을 디코딩 장치로 전송하는 경우에 비하여, 도 11에서와 같이, 소정 비트 영역들(1101, 1103 및 1111)을 포함하는 전송 스트림(TS)을 디코딩 장치(500)로 전송하는 경우가, 데이터 송수신량을 감소시킬 수 있다.
전술한 바와 같이, 본 발명의 일 실시예에 따른 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치는 n 개의 채널 신호들은 하나의 모노 신호로 다운 믹싱 및 업믹싱하는 과정에서 발생할 수 있는 신호 품질 저하를 방지할 수 있다.
구체적으로, 본 발명의 일 실시예에 따른 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치는 모노 신호를 원래의 채널 입력 신호들로 정확하게 복원할 수 있도록 하는 공간 파라미터를 생성 또는 처리할 수 있다.
또한 본 발명에 따른 신호 처리 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드 또는 프로그램으로서 구현하는 것도 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.
200: 엔코딩 장치
210: 다운 믹싱 부
220: 엔코더
500: 디코딩 장치
510: 역다중화부
520: 공간 파라미터 디코딩 부
530: 업 믹싱 부

Claims (21)

  1. 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들을 합산하여 생성된 합산 신호 간의 공간 파라미터를 생성하는 단계; 및
    상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  2. 제1항에 있어서, 상기 공간 파라미터를 생성하는 단계는
    상기 합산 신호와 상기 기준 채널 신호 간의 상관관계를 이용하여 상기 공간 파라미터를 생성하는 것을 특징으로 하는 신호 처리 방법.
  3. 제2항에 있어서, 상기 공간 파라미터를 생성하는 단계는
    상기 제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 상기 공간 파라미터를 n 개 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  4. 제3항에 있어서,
    상기 디코딩 장치가 엔코딩된 상기 n 개의 공간 파라미터들 및 엔코딩된 상기 모노 신호를 수신하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
  5. 제4항에 있어서,
    상기 n 개의 공간 파라미터들과 상기 모노 신호를 이용하여, 상기 제1 내지 제n 채널 신호들을 복원하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
  6. 제1항에 있어서, 상기 공간 파라미터는
    상기 기준 채널 신호와 상기 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 소정 각도 값으로 나타내는 앵글 파라미터를 포함하는 것을 특징으로 하는 신호 처리 방법.
  7. 제6항에 있어서, 상기 공간 파라미터를 생성하는 단계는
    제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 상기 기준 채널 신호인 제1 내지 제 n 채널 신호들 각각과 상기 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 나타내는 제1 내지 제 n 앵글 파라미터들을 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  8. 제7항에 있어서,
    상기 n 개의 앵글 파라미터들의 총 합은 소정 값으로 수렴하며,
    상기 공간 파라미터를 생성하는 단계는
    상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 상기 제 k 앵글 파라미터를 산출하는데 이용되는 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  9. 제8항에 있어서, 상기 공간 파라미터를 생성하는 단계는
    상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터의 값을 예측하는 단계;
    상기 예측된 제 k 앵글 파라미터의 값과 원래의 제 k 앵글 파라미터의 값을 비교하는 단계; 및
    상기 예측된 제 k 앵글 파라미터의 값과 상기 원래의 제 k 앵글 파라미터의 값의 차이 값을 상기 제 k 앵글 잔여 파라미터로 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  10. 제9항에 있어서,
    상기 제1 내지 제 n 앵글 파라미터들 중 상기 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 상기 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 상기 디코딩 장치가 수신하는 단계; 및
    수신된 상기 공간 파라미터 및 상기 소정 값을 이용하여, 상기 제 k 앵글 파라미터를 복원하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
  11. 제10항에 있어서, 상기 제 k 앵글 파라미터를 복원하는 단계는
    상기 소정 값에서 상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터 값들을 빼고, 상기 뺀 값에서 상기 제 k 앵글 잔여 파라미터의 값을 보상한 값을 상기 제 k 앵글 파라미터로 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  12. 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들을 합산하여 생성된 합산 신호 간의 상관관계를 이용하여 공간 파라미터를 생성하는 단계; 및
    상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  13. 제12항에 있어서,
    디코딩 장치에서, 엔코딩된 상기 모노 신호와 엔코딩된 상기 공간 파라미터를 수신 및 디코딩하는 단계; 및
    디코딩된 상기 모노 신호와 상기 공간 파라미터를 이용하여, 상기 제1 내지 제 n 채널 신호들을 복원하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  14. 제1 내지 제n 채널 신호들을 모노 신호로 다운 믹싱하는 엔코딩 장치에서, 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들 간의 공간 파라미터를 생성하는 다운 믹싱 부; 및
    상기 공간 파라미터를 엔코딩하여 디코딩 장치로 전송하는 엔코더를 포함하는 엔코딩 장치.
  15. 제14항에 있어서, 상기 다운 믹싱 부는
    상기 나머지 채널 신호들을 합산하고, 상기 합산된 신호와 상기 기준 채널 신호 간의 상관관계를 이용하여 상기 공간 파라미터를 생성하는 것을 특징으로 하는 엔코딩 장치.
  16. 제15항에 있어서, 상기 다운 믹싱 부는
    상기 제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 상기 공간 파라미터를 n 개 생성하는 것을 특징으로 하는 엔코딩 장치.
  17. 제16항에 있어서, 상기 엔코더는
    상기 n 개의 공간 파라미터를 포함하는 공간 파라미터 셋을 엔코딩하고, 상기 모노 신호를 엔코딩하며, 상기 엔코딩된 공간 파라미터 셋 및 상기 모노 신호를 포함하는 전송 스트림을 생성하고, 상기 전송 스트림을 상기 디코딩 장치로 전송하는 것을 특징으로 하는 엔코딩 장치.
  18. 제14항에 있어서,
    상기 공간 파라미터는
    상기 기준 채널 신호와 상기 나머지 채널 신호들 간의 신호 크기에 대한 상관관계를 소정 각도 값으로 나타내는 앵글 파라미터를 포함하며,
    상기 다운 믹싱 부는
    제1 내지 제 n 채널 신호들 각각을 상기 기준 채널 신호로 하여, 제1 내지 제 n 앵글 파라미터들을 생성하는 것을 특징으로 하는 엔코딩 장치.
  19. 제18항에 있어서,
    상기 n 개의 앵글 파라미터들의 총 합은 소정 값으로 수렴하며,
    상기 다운 믹싱 부는
    상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터를 제외한 앵글 파라미터들 및 상기 제 k 앵글 파라미터를 산출하는데 이용되는 제 k 앵글 잔여 파라미터를 포함하는 상기 공간 파라미터를 생성하는 것을 특징으로 하는 엔코딩 장치.
  20. 제19항에 있어서, 상기 다운 믹싱 부는
    상기 제1 내지 제 n 앵글 파라미터들 중 제 k 앵글 파라미터의 값을 예측하고, 상기 예측된 제 k 앵글 파라미터의 값과 원래의 제 k 앵글 파라미터의 값을 비교하며, 상기 예측된 제 k 앵글 파라미터의 값과 원래의 제 k 앵글 파라미터의 값의 차이 값을 상기 제 k 앵글 잔여 파라미터로 생성하는 것을 특징으로 하는 엔코딩 장치.
  21. 엔코딩 장치로부터 전송 스트림을 수신하고, 엔코딩된 공간 파라미터를 분리하는 역다중화부;
    상기 공간 파라미터를 디코딩하는 공간 파라미터 디코딩 부; 및
    제1 내지 제n 채널 신호들을 다운 믹싱 및 엔코딩하여 생성된 모노 신호를 디코딩하고, 상기 디코딩된 모노 신호 및 상기 디코딩된 공간 파라미터를 이용하여 상기 제1 내지 제 n 채널 신호들을 복원하는 업 믹싱 부를 포함하며,
    상기 공간 파라미터는
    상기 제1 내지 제 n 채널 신호들 중 어느 하나의 채널 신호인 기준 채널 신호와 상기 제1 내지 제 n 채널 신호들 중 상기 기준 채널 신호를 제외한 나머지 채널 신호들을 합산한 합산 신호 간의 제1 공간 파라미터 및 상기 기준 채널 신호와 상기 모노 신호 간의 제2 공간 파라미터 중 적어도 하나를 포함하는 것을 특징으로 하는 엔코딩 장치.
KR1020110092560A 2011-09-14 2011-09-14 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 KR101842257B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110092560A KR101842257B1 (ko) 2011-09-14 2011-09-14 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US13/614,213 US20130066639A1 (en) 2011-09-14 2012-09-13 Signal processing method, encoding apparatus thereof, and decoding apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110092560A KR101842257B1 (ko) 2011-09-14 2011-09-14 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치

Publications (2)

Publication Number Publication Date
KR20130029253A KR20130029253A (ko) 2013-03-22
KR101842257B1 true KR101842257B1 (ko) 2018-05-15

Family

ID=47830629

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110092560A KR101842257B1 (ko) 2011-09-14 2011-09-14 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치

Country Status (2)

Country Link
US (1) US20130066639A1 (ko)
KR (1) KR101842257B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3077900C (en) 2012-10-24 2024-04-30 Precision Planting Llc Agricultural trench depth sensing systems, methods, and apparatus
WO2014168439A1 (ko) * 2013-04-10 2014-10-16 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
US9679571B2 (en) 2013-04-10 2017-06-13 Electronics And Telecommunications Research Institute Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
TWI774136B (zh) * 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP4243015A4 (en) 2021-01-27 2024-04-17 Samsung Electronics Co., Ltd. AUDIO PROCESSING APPARATUS AND METHOD
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010086218A1 (en) * 2009-01-28 2010-08-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1768107B1 (en) * 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7788106B2 (en) * 2005-04-13 2010-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Entropy coding with compact codebooks
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100953640B1 (ko) * 2006-01-19 2010-04-20 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
KR100754220B1 (ko) * 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
JP5222279B2 (ja) * 2006-03-28 2013-06-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネルオーディオ再構成における信号整形のための改善された方法
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR100829560B1 (ko) * 2006-08-09 2008-05-14 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
JP5366104B2 (ja) * 2008-06-26 2013-12-11 オランジュ マルチチャネル・オーディオ信号の空間合成
CN103634733B (zh) * 2008-07-31 2016-05-25 弗劳恩霍夫应用研究促进协会 双耳信号的信号生成
KR101615262B1 (ko) * 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010086218A1 (en) * 2009-01-28 2010-08-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal

Also Published As

Publication number Publication date
US20130066639A1 (en) 2013-03-14
KR20130029253A (ko) 2013-03-22

Similar Documents

Publication Publication Date Title
RU2625444C2 (ru) Система обработки аудио
KR101613975B1 (ko) 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
RU2369917C2 (ru) Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования
US7916873B2 (en) Stereo compatible multi-channel audio coding
CN103559884B (zh) 多声道信号的编码/解码装置及方法
KR101842257B1 (ko) 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
EP2306452A1 (en) Sound coding device, sound decoding device, sound coding/decoding device, and conference system
US20090210236A1 (en) Method and apparatus for encoding/decoding stereo audio
KR20190072647A (ko) 위상 보상을 이용하여 멀티 채널 신호를 다운믹싱 또는 업믹싱하는 장치 및 방법
EP3165005A1 (en) Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation
EP2989631A1 (en) Audio signal encoder
EP3164867A1 (en) Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation
JP4892184B2 (ja) 音響信号符号化装置及び音響信号復号装置
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
WO2014191793A1 (en) Audio signal encoder
JP5949270B2 (ja) オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
JP6179122B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP5998467B2 (ja) 復号装置、復号方法、及び復号プログラム
KR102654181B1 (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치
JP5990954B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム
JP2014010335A (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant