KR20160081844A - 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 - Google Patents

다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 Download PDF

Info

Publication number
KR20160081844A
KR20160081844A KR1020150190159A KR20150190159A KR20160081844A KR 20160081844 A KR20160081844 A KR 20160081844A KR 1020150190159 A KR1020150190159 A KR 1020150190159A KR 20150190159 A KR20150190159 A KR 20150190159A KR 20160081844 A KR20160081844 A KR 20160081844A
Authority
KR
South Korea
Prior art keywords
mps
channel audio
audio signal
channels
audio signals
Prior art date
Application number
KR1020150190159A
Other languages
English (en)
Inventor
백승권
서정일
성종모
이태진
최진수
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US15/540,800 priority Critical patent/US10529342B2/en
Priority to PCT/KR2015/014543 priority patent/WO2016108655A1/ko
Publication of KR20160081844A publication Critical patent/KR20160081844A/ko
Priority to US16/735,522 priority patent/US11328734B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치가 개시된다. N개 채널의 다채널 오디오 신호가 MPS 표준에서 정의하는 채널 개수를 초과하는 경우 MPS 표준 동작을 바이패스하고 임의적인 트리를 활용함으로써 처리하는 방법 및 장치가 개시된다.

Description

다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 {ENCODING METHOD AND ENCODER FOR MULTI-CHANNEL AUDIO SIGNAL, AND DECODING METHOD AND DECODER FOR MULTI-CHANNEL AUDIO SIGNAL}
본 발명은 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치에 관한 것으로, 보다 구체적으로는 채널수가 증가하더라도 음질 열화없이 압축할 수 있는 방법 및 장치에 관한 것이다.
MPS(MPEG Surround)는 5.1채널, 7.1채널 등 다채널 오디오 코딩을 위한 오디오 코덱이다. MPS에 의해, 다채널 오디오 신호를 높은 압축율로 압축하여 전송이 가능하다.
다만, 인코딩/디코딩 과정에서 하위 호환이라는 제약 사항을 가진다. 즉, MPS를 통해 생성된 다채널 오디오 신호의 비트스트림은 기존의 오디오 코덱을 통해 모노나 스테레오 형태로 재생이 가능해야 하는 하위 호환이 요구된다.
따라서, MPS에 입력되는 다채널 오디오 신호의 채널수가 증가하더라도 최종적으로 출력되어 전송되는 오디오 신호는 모노 또는 스테레오로 표현되어야 한다. 그러면, 디코더는 인코더로부터 수신한 부가 정보를 이용하여 오디오 비트스트림으로부터 다채널 오디오 신호를 복원할 수 있다. 이 때, 디코더는 업믹싱을 위한 부가 정보로 다채널 오디오 신호를 복원할 수 있다.
다만, 최근에 통신 환경이 개선되면서 전송 대역폭이 증가함에 따라 오디오 신호에 할당되는 대역폭도 증가하였다. 그렇기 때문에, 대역폭에 대응되도록 과도하게 압축하기 보다는 원래 다채널 오디오 신호가 가지는 음질을 유지하는 방향으로 기술이 발전하고 있다. 그렇다고 하더라도, 매우 많은 수의 채널을 가지는 다채널 오디오 신호를 처리하기 위해서는, 여전히 전송할 때 압축이 필요하다.
따라서, 기존보다 채널 수가 증가하는 경우라도, 다채널 오디오 신호의 품질을 유지하면서 일정 수준 이상의 압축을 통해 데이터량을 줄여서 전송할 수 있는 방법이 요구된다.
본 발명은 N개 채널의 다채널 오디오 신호가 MPS 표준에서 정의하는 채널 개수를 초과하는 경우 MPS 표준 동작을 바이패스하고 임의적인 트리를 활용함으로써 처리하는 방법 및 장치를 제공한다.
본 발명의 일실시예에 따른 다채널 오디오 신호의 인코딩 방법은 MPS 인코더를 통해 N개 채널의 오디오 신호를 다운믹스하여 N/2개 채널의 오디오 신호를 생성하는 단계; 및 USAC 인코더를 통해 상기 N/2개 채널의 오디오 신호의 코어 대역에 대해 인코딩하는 단계를 포함할 수 있다.
상기 N/2개 채널 신호를 생성하는 단계는, N/2개 TTO(Two-To-One) 코딩 모듈을 이용하여 N개 채널의 오디오 신호를 다운믹싱함으로써, N/2개 채널의 오디오 신호를 생성할 수 있다.
상기 인코딩 방법은 샘플링율 변환부를 통해 오디오 신호에 대해 샘플링율을 변환하는 단계를 더 포함하고, 상기 샘플링율 변환부는, 상기 MPS 인코더 이전에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 인코더 이후에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환할 수 있다.
상기 샘플링율을 변환하는 단계는, 상기 USAC 인코더에 적용되는 비트레이트에 따라 오디오 신호에 대해 샘플링율을 변환할 수 있다.
상기 N/2개 채널의 오디오 신호를 생성하는 단계는, 상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하여 N/2개 채널의 오디오 신호를 생성할 수 있다.
상기 N/2개 채널의 오디오 신호를 생성하는 단계는, 상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호의 디코딩 방법은 USAC 디코더를 통해 N/2개 채널의 오디오 신호의 코어 대역에 대해 디코딩하는 단계; 및 MPS 디코더를 통해 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 단계를 포함할 수 있다.
상기 N개 채널의 오디오 신호를 생성하는 단계는, N/2개 OTT(One-To-Two) 코딩 모듈을 이용하여 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 생성할 수 있다.
상기 디코딩 방법은 샘플링율 변환부를 통해 오디오 신호에 대해 샘플링율을 변환하는 단계를 더 포함하고, 상기 샘플링율 변환부는, 상기 MPS 디코더 이전에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 디코더 이후에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환할 수 있다.
상기 샘플링율을 변환하는 단계는, 상기 USAC 디코더에 적용되는 비트레이트에 따라 오디오 신호에 대해 샘플링율을 변환할 수 있다.
상기 N개 채널의 오디오 신호를 생성하는 단계는, 상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성할 수 있다.
상기 N개 채널의 오디오 신호를 생성하는 단계는, 상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호의 인코딩 장치는 N개 채널의 오디오 신호를 다운믹스하여 N/2개 채널의 오디오 신호를 생성하는 MPS 인코더; 및 USAC 인코더를 통해 상기 N/2개 채널의 오디오 신호의 코어 대역에 대해 인코딩하는 USAC 인코더를 포함할 수 있다.
상기 인코딩 장치는 오디오 신호에 대해 샘플링율을 변환하는 샘플링율 변환부를 더 포함하고, 상기 샘플링율 변환부는, 상기 MPS 인코더 이전에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 인코더 이후에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환할 수 있다.
상기 MPS 인코더는, 상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하여 N/2개 채널의 오디오 신호를 생성할 수 있다.
상기 MPS 인코더는, 상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호의 디코딩 장치는 N개 채널의 오디오 신호의 코어 대역에 대해 디코딩하는 USAC 디코더; 및 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 MPS 디코더를 포함할 수 있다.
상기 MPS 디코더는, N/2개 OTT(One-To-Two) 코딩 모듈을 이용하여 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 생성할 수 있다.
상기 디코딩 장치는, 오디오 신호에 대해 샘플링율을 변환하는 샘플링율 변환부를 더 포함하고, 상기 샘플링율 변환부는, 상기 MPS 디코더 이전에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 디코더 이후에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환할 수 있다.
상기 MPS 디코더는, 상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성할 수 있다.
본 발명의 일실시예에 따르면, N개 채널의 다채널 오디오 신호가 MPS 표준에서 정의하는 채널 개수를 초과하는 경우 MPS 표준 동작을 바이패스하고 임의적인 트리를 활용함으로써 처리할 수 있다.
도 1은 일실시예에 따른 인코딩 장치와 디코딩 장치를 도시한 도면이다.
도 2는 일실시예에 따른 인코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 3은 다른 실시예에 따른 인코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 4는 일실시예에 따른 제1 인코딩부의 동작을 설명하기 위한 도면이다.
도 5는 일실시예에 따른 디코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 6은 다른 실시예에 따른 디코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 7은 일실시예에 따른 제2 디코딩부의 동작을 설명하기 위한 도면이다.
도 8은 일실시예에 따른 Arbitrary tree를 이용하여 업믹싱하는 과정을 설명하기 위한 도면이다.
도 9는 일실시예에 따른 제2 디코딩부에서 비상관성 신호를 이용하여 업믹싱하는 과정을 설명하기 위한 도면이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 일실시예에 따른 인코딩 장치와 디코딩 장치를 도시한 도면이다.
본 발명의 일실시예에 따른, 인코딩 장치(100)는 N개 채널 신호를 다운믹싱하여 N/2개 채널 신호를 생성할 수 있다. 그런 후, 인코딩 장치(100)는 N/2개 채널 신호를 인코딩하여 1개 채널 신호(모노), 2개 채널 신호(스테레오), 또는 M개 채널 신호(다채널)를 생성할 수 있다.
그러면, 디코딩 장치(101)는 인코딩 장치(100)에서 생성한 1개 채널 신호(모노), 2개 채널 신호(스테레오), 또는 M개 채널 신호(다채널)를 이용하여 N/2개 채널 신호를 생성한 후, 이를 업믹싱하여 N개 채널 신호를 생성할 수 있다. 여기서, N/2개 채널 신호에서 N은 10 이상일 수 있다.
도 2는 일실시예에 따른 인코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 2를 참고하면, 인코딩 장치는 제1 인코딩부(201), 샘플링율 변환부(202) 및 제2 인코딩부(203)를 포함할 수 있다. 제1 인코딩부(201)는 MPS 인코더로 정의된다. 그리고, 제2 인코딩부(203)는 USAC(Unified Speech and Audio Codec) 인코더로 정의된다. 즉, N개 채널의 오디오 신호를 다운믹스하여 N/2개 채널의 오디오 신호를 생성할 수 있다.
그러면, 샘플링율 변환부(202)는 N/2개 채널의 오디오 신호에 대해 샘플링율을 변환할 수 있다. 샘플링율 변환부(202)는 제2 인코딩부(203)인 USAC 인코더에 할당된 비트레이트에 기초하여 다운샘플링할 수 있다. 만약, 제2 인코딩부(203)인 USAC 인코더에 충분히 높은 비트레이트가 할당된다면, 샘플링율 변환부(202)는 바이패스될 수 있다.
이 후, 제2 인코딩부(203)는 샘플링율이 변환된 N/2개 채널의 오디오 신호의 코어 대역에 대해 인코딩할 수 있다. 그러면, 제2 인코딩부(203)를 통해 M개 채널의 오디오 신호가 출력될 수 있다.
종래의 MPS 인코더를 통해 출력되는 다운믹스 신호는 1채널, 2채널, 및 5.1 채널로 한정되어 있다. 하지만, 본 발명의 일실시예에 따른 제1 인코딩부(201)는 N개 채널의 오디오 신호를 다운믹싱한 후, 다운믹싱된 결과인 N/2개 채널의 오디오 신호를 출력할 수 있다. 여기서, N/2개 채널의 오디오 신호는 최소한 5.1 채널 이상을 의미하므로, N은 10.2 채널 이상이 될 수 있다.
도 3은 다른 실시예에 따른 인코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 3은 도 2에서 설명하는 구성 요소와 동일하나, 그 순서가 변경된 실시예를 나타낸다. 구체적으로, 도 2는 제1 인코딩부(201)와 제2 인코딩부(203) 사이에 샘플링율 변환부(202)가 존재하는 실시예를 나타낸다. 하지만, 도 3은 샘플링율 변환부(301) 이후에, 제1 인코딩부(302)와 제2 인코딩부(303)가 배치된 실시예를 나타낸다.
도 4는 일실시예에 따른 제1 인코딩부의 동작을 설명하기 위한 도면이다.
도 4를 참고하면, 제1 인코딩부(401)는 복수의 TTO 모듈(402)들을 포함할 수 있다. 여기서, 복수의 TTO 모듈(402)들 각각은 2개 채널의 오디오 신호를 다운믹싱하여 1개 채널의 오디오 신호를 출력할 수 있다. 즉, 도 4와 같이 입력된 N개 채널의 오디오 신호를 다운믹싱하여 N/2개 채널의 오디오 신호를 출력하기 위해서, 제1 인코딩부(401)는 N/2개의 TTO 모듈(402)을 포함할 수 있다.
제1 인코딩부(401)가 기존의 MPS 표준을 따른다면, 제1 인코딩부(401)를 통해 출력되는 오디오 신호는 2개 채널, 5.1개 채널만 가능하다. 하지만, 본 발명의 일실시예에 따르면, 제1 인코딩부(401)는 N개 채널의 오디오 신호로부터 MPS에 따라 N/2개 채널의 오디오 신호를 출력할 수 있다. 이 때, 제1 인코딩부(401)는 MPS를 제어하기 위해 추가적인 구문을 고려할 필요가 있다. 일례로, 제1 인코딩부(401)는 임의적인 트리(arbitrary tree)를 활용한 코딩 모드를 활용하여 MPS를 제어하기 위한 추가적인 구문을 정의할 수 있다.
도 5는 일실시예에 따른 디코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 5를 참고하면, 디코딩 장치는 제1 디코딩부(501), 샘플링율 변환부(502), 및 제2 디코딩부(503)를 포함할 수 있다. 제1 디코딩부(501)는 M개 채널의 오디오 신호로부터 N/2개 채널의 오디오 신호를 출력할 수 있다. 여기서, 제1 디코딩부(501)는 USAC 디코더로 정의될 수 있다.
그리고, 샘플링율 변환부(502)는 N/2개 채널의 오디오 신호에 대한 샘플링율을 변환할 수 있다. 이 때, 샘플링율 변환부(502)는 인코딩 장치에서 샘플링율이 변환된 오디오 신호에 대해 원래의 샘플링율로 변환할 수 있다. 다시 말해서, 도 2나 도 3에서 샘플링율 변환이 수행된 경우, 샘플링율 변환부(502)가 동작한다. 만약, 도 2나 도 3에서 샘플링율 변환이 수행되지 않은 경우, 샘플링율 변환부(502)는 동작하지 않고 바이패스될 수 있다.
한편, 제2 디코딩부(503)는 샘플링율 변환부(502)에서 출력된 N/2개 채널의 오디오 신호를 업믹싱하여 N/2개 채널의 오디오 신호를 출력할 수 있다.
종래의 MPS 디코더에 입력되는 다운믹스 신호는 1채널, 2채널, 및 5.1 채널로 한정되어 있다. 하지만, 본 발명의 일실시예에 따른 제2 디코딩부(201)는 N/2개 채널의 오디오 신호를 업믹싱한 후, 업믹싱된 결과인 N개 채널의 오디오 신호를 출력할 수 있다. 여기서, 제2 디코딩부(503)에 입력되는 N/2개 채널의 오디오 신호는 최소한 5.1 채널 이상을 의미하므로, N은 10.2 채널 이상이 될 수 있다.
도 6은 다른 실시예에 따른 디코딩 장치의 세부 구성 요소를 도시한 도면이다.
도 6은 도 5와 달리 제1 디코딩부(601), 제2 디코딩부(602) 및 샘플링율 변환부(603)의 순서에 따라 오디오 신호를 처리할 수 있다. 제1 디코딩부(601)는 M개 채널의 오디오 신호를 디코딩하여 N/2개 채널의 오디오 신호를 출력할 수 있다. 그러면, 제2 디코딩부(602)는 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 출력할 수 있다. 이 후, 샘플링율 변환부(603)는 제2 디코딩부(602)를 통해 출력된 N개 채널의 오디오 신호에 대해 샘플링율을 변환할 수 있다.
도 7은 일실시예에 따른 제2 디코딩부의 동작을 설명하기 위한 도면이다.
도 5 및 도 6에서 설명했던 제2 디코딩부(701)는 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 출력할 수 있다. 이 때, 제2 디코딩부(701)는 복수의 OTT 모듈(702)을 포함할 수 있다. OTT 모듈(702)은 1개 채널의 오디오 신호를 업믹싱하여 스테레오 형태의 2개 채널의 오디오 신호를 출력할 수 있다.
따라서, 제2 디코딩부(701)가 N/2개 채널의 오디오 신호를 업믹싱함으로써 N개 채널의 오디오 신호를 출력하기 위해서, 제2 디코딩부(701)는 N/2개의 OTT 모듈(702)을 포함할 수 있다.
제2 디코딩부(701)가 기존의 MPS 표준을 따른다면, 제2 디코딩부(701)에 입력되어 처리될 수 있는 다운믹스된 오디오 신호는 1개 채널, 2개 채널, 5.1개 채널만 가능하다. 하지만, 본 발명의 일실시예에 따르면, 제2 디코딩부(701)는 N/2개 채널의 오디오 신호로부터 MPS에 따라 N개 채널의 오디오 신호를 출력할 수 있다. 여기서, N은 10.2 이상일 수 있다.
이 때, 제2 디코딩부(701)는 MPS를 제어하기 위해 추가적인 구문을 고려할 필요가 있다. 일례로, 제2 디코딩부(701)는 임의적인 트리(arbitrary tree)를 활용한 코딩 모드를 활용하여 MPS를 제어하기 위한 추가적인 구문을 정의할 수 있다.
도 8은 일실시예에 따른 Arbitrary tree를 이용하여 업믹싱하는 과정을 설명하기 위한 도면이다.
도 8에서 설명하는 예시는 MPS 디코더에 해당하는 도 5의 제2 디코딩부(503) 및 도 6의 제2 디코딩부(602)에 관한 것이다.
Arbitrary tree를 이용하는 코딩 모드는 MPS 인코더의 출력인 다운믹스 신호의 개수에 기초하여 동작한다. 아래 표 1은 현재 MPS(MPEG Surround) 표준에서 정의되고 있는 MPS 입출력 관계를 나타낸다. 표 1은 MPS 표준인 ISO/IEC 23003-1 Table 40(bsTreeConfig)를 나타낸다. 표 2는 bsTreeConfig에 따른 다운믹스 채널의 구성을 나타낸다.
bsTreeConfig Meaning
0 5151 configuration
numOttBoxes = 5
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 0
defaultCld[3] = 0
defaultCld[4] = 1
defaultCld[5] = 0
ottModeLfe[0] = 0
ottModeLfe[1] = 0
ottModeLfe[2] = 0
ottModeLfe[3] = 0
ottModeLfe[4] = 1
numTttBoxes = 0
numInChan = 1
numOutChan = 6
output channel ordering: L, R, C, LFE, Ls, Rs
1 5152 configuration
numOttBoxes = 5
defaultCld[0] = 1
defaultCld[1] = 0
defaultCld[2] = 1
defaultCld[3] = 1
defaultCld[4] = 1
defaultCld[5] = 0
ottModeLfe[0] = 0
ottModeLfe[1] = 0
ottModeLfe[2] = 1
ottModeLfe[3] = 0
ottModeLfe[4] = 0
numTttBoxes=0
numInChan = 1
numOutChan = 6
output channel ordering: L, Ls, R, Rs, C, LFE
2 525 configuration
numOttBoxes = 3
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 1
defaultCld[3] = 1
defaultCld[4] = 0
defaultCld[5] = 1
defaultCld[6] = 0
defaultCld[7] = 0
defaultCld[8] = 0
ottModeLfe[0] = 1
ottModeLfe[1] = 0
ottModeLfe[2] = 0
numTttBoxes=1
numInChan = 2
numOutChan = 6
output channel ordering: L, Ls, R, Rs, C, LFE
3 7271 configuration (5/2.1)
numOttBoxes = 5
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 1
defaultCld[3] = 1
defaultCld[4] = 1
defaultCld[5] = 1
defaultCld[6] = 0
defaultCld[7] = 1
defaultCld[8] = 0
defaultCld[9] = 0
defaultCld[10] = 0
ottModeLfe[0] = 1
ottModeLfe[1] = 0
ottModeLfe[2] = 0
ottModeLfe[3] = 0
ottModeLfe[4] = 0
numTttBoxes = 1
numInChan = 2
numOutChan = 8
output channel ordering: L, Lc, Ls, R, Rc, Rs, C, LFE
4 7272 configuration (3/4.1)
numOttBoxes = 5
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 1
defaultCld[3] = 1
defaultCld[4] = 1
defaultCld[5] = 1
defaultCld[6] = 0
defaultCld[7] = 1
defaultCld[8] = 0
defaultCld[9] = 0
defaultCld[10] = 0
ottModeLfe[0] = 1
ottModeLfe[1] = 0
ottModeLfe[2] = 0
ottModeLfe[3] = 0
ottModeLfe[4] = 0
numTttBoxes = 1
numInChan = 2
numOutChan = 8
output channel ordering: L, Lsr, Ls, R, Rsr, Rs, C, LFE
5 7571 configuration (5/2.1)
numOttBoxes = 2
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 0
defaultCld[3] = 0
defaultCld[4] = 0
defaultCld[5] = 0
defaultCld[6] = 0
defaultCld[7] = 0
ottModeLfe[0] = 0
ottModeLfe[1] = 0
numTttBoxes = 0
numInChan = 6
numOutChan = 8
output channel ordering: L, Lc, Ls, R, Rc, Rs, C, LFE
6 7572 configuration (3/4.1)
numOttBoxes = 2
defaultCld[0] = 1
defaultCld[1] = 1
defaultCld[2] = 0
defaultCld[3] = 0
defaultCld[4] = 0
defaultCld[5] = 0
defaultCld[6] = 0
defaultCld[7] = 0
ottModeLfe[0] = 0
ottModeLfe[1] = 0
numTttBoxes = 0
numInChan = 6
numOutChan = 8
output channel ordering: L, Lsr, Ls, R, Rsr, Rs, C, LFE
7...15 Reserved
Configuration bsTreeConfig
Figure pat00001
5-1-5 0,1
Figure pat00002
5-2-5 2
Figure pat00003
7-2-71 3
Figure pat00004
7-2-72 4
Figure pat00005
7-5-71 5
Figure pat00006
7-5-72 6
Figure pat00007
BsTreeConfig는 MPS 입출력 관계를 정의하는 구문이다. BsTreeConfig에 따라 MPS 인코더에 입력되는 신호와 MPS 인코더에서 출력되는 신호의 디코딩 과정이 정의된다. BsTreeConfig가 0인 경우, MPS 인코더는 6개 채널(5.1)의 오디오 신호를 입력받아서, 1개 채널의 다운믹스 신호를 출력할 수 있다. 그러면, MPS 디코더는 1개 채널의 다운믹스 신호를 업믹싱하여 다시 6개 채널의 오디오 신호를 복원할 수 있다.
이를 위해, MPS 디코더는 5개의 OTT 모듈이 필요하다. 그리고, OTT 모듈마다 업믹싱을 위한 파라미터인 CLD(Channel Level Difference)가 필요하다. 이 때, CLD는 OTT 모듈에 따라 defaultCLD[0~5]까지의 플래그가 정의되어 있다. 여기서, defaultCLD의 식별 번호는 OTT 모듈의 위치에 대응한다. defaultCLD가 1인 OTT 모듈은 CLD가 enable된다. ottModeLfe도 CLD와 같이 업믹싱을 위한 파라미터로 활용되며, 입력 채널에 Lfe가 있을 때 활용되는 플래그이다.
현재 MPS 표준에 defaultCLD[0~5]까지의 플래그만 정의되어 있으므로, 최대 6개의 OTT 모듈만 활용 가능하다. 그렇기 때문에, 현재 MPS 표준은 MPS 인코더에 입력되는 채널의 개수가 10채널 이상이고, 5개 채널의 오디오 신호가 다운믹스 신호로서 전송되는 예시를 만족시킬 수 없다.
BsTreeConfig Meaning
reserved 12-12 configuration
[N( DMX )-N(output)]
numOttBoxes = 0
defaultCld[0] = 0
defaultCld[1] = 0
defaultCld[2] = 0
defaultCld[3] = 0
defaultCld[4] = 0
defaultCld[5] = 0
ottModeLfe[0] = 0
ottModeLfe[1] = 0
ottModeLfe[2] = 0
ottModeLfe[3] = 0
ottModeLfe[4] = 0
numTttBoxes = 0
numInChan = 12
numOutChan = 12
하지만, 본 발명의 일실시예에 따르면, 표 1에서 MPS 표준에 정의된 reserved bit를 이용하여 채널 수가 10개 이상인 경우에도 표현할 수 있다. 예를 들어 채널의 개수인 N이 24이고, 다운믹스된 N/2개 채널은 12인 경우, 표 3과 같이 표현될 수 있다. 하지만, 표 3을 참고하면, MPS 표준에서 정의하는 OTT 모듈을 이용할 수 없다.
따라서, 입력된 채널의 개수가 10개 이상인 경우, 종래의 MPS 인코더를 통해 다운믹스된 N/2개 채널의 오디오 신호를 생성하기 위해 OTT 모듈을 이용할 수 없다. 따라서, 이와 같은 경우 디코딩 장치는 기존의 MPS 디코더를 바이패스하는 형태로 구현될 수 밖에 없다.
종래의 MPS 디코더가 처리할 수 없는 채널에 대응하는 오디오 신호를 처리하기 위해, 본 발명의 일실시예에 따르면, 도 8과 같이 Arbitrary Tree 코딩 모드가 활용될 수 있다. Arbitrary Tree 코딩 모드는 MPS 출력 신호의 채널마다 추가적인 OTT 모듈이 적용되는 Tree 구조를 활용하는 것을 의미한다.
결론적으로, 본 발명의 일실시예에 따르면, 입력 신호의 채널 수가 MPS 표준에서 지원하는 채널 수를 초과하는 경우, 디코딩 장치는 표 3과 같은 구문 정의로 MPS 표준에서 정의하는 기본 블록을 바이패스(bypass)하고, arbitrary tree 코딩 모드를 이용하여 각 채널에 OTT 모듈을 인가함으로써 입력 신호를 처리할 수 있다.
따라서, 기존의 MPS 표준이 지원하는 채널(1채널, 2채널, 5.1 채널)에 대응하는 다운믹스 신호가 MPS 디코더에 입력되는 경우, MPS 디코더는 도 8의 MPS 표준 모드에 따라 동작한다. 하지만, 기존의 MPS 표준이 지원하지 않는 채널에 대응하는 다운믹스 신호가 MPS 디코더에 입력되는 경우, MPS 디코더는 도 8의 N-N/2 동작 모드에 따라 동작한다. 즉, 기존의 MPS 표준이 지원하지 않는 채널에 대응하는 다운믹스 신호가 MPS 디코더에 입력되는 경우, 표 3과 같은 구문 정의를 통해 MPS 기본 블록을 바이패스하고, 도 8의 N-N/2 동작 모드와 같은 arbitrary tree 모드를 통해 각 채널에 OTT 모듈을 추가함으로써 입력된 오디오 신호가 처리될 수 있다. Arbitrary tree는 MPS 표준에 정의되어 있으며, MPS 표준에 정의되지 않은 채널 구조를 처리하기 위해 사용될 수 있다.
Arbitrary Tree가 사용되는 경우, 다음과 같이 처리될 수 있다. 여기서, numOTTBoxexAT는 Treeconfig()에 의해 정의된다.
ArbitraryTreeData()
{
for (i=0; i<numOttBoxesAT; i++) { Note 1
EcData(ATD, i, 0, bsOttBandsAT[i]);
}
}
이 때, ATD(ArbitraryTreeData) 파라미터는 Arbitrary tree의 각각의 OTT 박스에 전달된다. 그리고, ATD 파라미터의 역양자화는 다음 수학식 1에 의해 처리된다.
Figure pat00008
그리고, arbitrary downmix gain 파라미터는 다음 수학식 2에 따라 CLD 파라미터 역 양자화 테이블을 이용하여 역양자화된다.
Figure pat00009
Arbitrary tree는 bsOTTBoxPresent[ch]에 의해 표현되는 Tree들로 구성된다. 예를 들어, bsOTTBoxPresent[ch]에 포함된 비트스트링인 1과 0에 따라 어떻게 서브 트리가 표현되는지 여부가 결정된다. 이 때, 비트스트링이 1이면, OTT 박스가 이용되고, 비트스트링이 0이면 OTT 박스가 이용되지 않는다. 그리고, 비트스트링에 포함된 0과 1의 위치에 따라 Arbitrary Tree에서의 depth가 결정된다. 예를 들어, bsOTTBoxPresent[ch]에서 첫번째 비트스트링은 depth 1의 노드에 대응하고, 두번째 비트스트링은 depth 2의 노드에 대응한다.
도 8에 의하면, N-N/2 동작 모드의 경우 y벡터에 해당하는 오디오 신호가 생성되지 않거나, 또는 x벡터에 해당하는 신호와 동일한 결과가 출력된다. Arbitrary tree 코딩 모드로 동작하는 post matrix[M3]를 통해 최종적인 Z벡터에 해당하는 오디오 신호가 출력된다. Arbitrary Tree는 미리 설정된 트리인 5-2-5, 7-5-7와 같은 구조로부터 확장되어 더 많은 채널을 출력할 수 있다.
도 8의 MPS 표준 모드에서 Arbitrary Tree는 미리 설정된 Tree와 결합될 수 있다. Arbitrary Tree로부터 출력되는 서브밴드 출력 신호는 모든 시간 슬롯 n과 모든 하이브리드 서브밴드 k에 의해 z로 정의된다. 도 8에서 z는 다음 수학식 3에 의해 결정될 수 있다. M3는 MPS 표준의 section 6.5.4에 정의된다.
Figure pat00010
도 9는 일실시예에 따른 제2 디코딩부에서 비상관성 신호를 이용하여 업믹싱하는 과정을 설명하기 위한 도면이다.
도 9를 참고하면, 제2 디코딩부는 복수의 OTT 모듈(901)과 이에 대응하는 비상관성 신호 생성기(Decorrelator)(902)를 포함한다. OTT 모듈에 입력되는 오디오 신호는 1개 채널의 오디오 신호를 의미하는 다운믹스 신호이다. 그러면, OTT 모듈(901)은 채널 관련 파라미터(CLD, ICC, IPD)와 비상관성 신호 생성기(902)를 통해 생성된 비상관성 신호 및 다운믹스 신호를 이용하여 2개 채널의 오디오 신호를 출력할 수 있다.
본 발명의 일실시예에 따르면, MPS 인코더를 통해 10채널 이상에 해당하는 N개 채널의 오디오 신호를 N/2개 채널의 오디오 신호와 같은 다운믹스 신호가 생성된다. 그리고, MPS 디코더를 통해 MPS 인코더에서 생성된 다운믹스 신호를 arbitrary tree 코딩 모드가 적용되는 N-N/2 동작 모드를 통해 원래의 N개 채널의 오디오 신호를 복원할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
100: 인코딩 장치
101: 디코딩 장치

Claims (20)

  1. MPS 인코더를 통해 N개 채널의 오디오 신호를 다운믹스하여 N/2개 채널의 오디오 신호를 생성하는 단계;
    USAC 인코더를 통해 상기 N/2개 채널의 오디오 신호의 코어 대역에 대해 인코딩하는 단계
    를 포함하는 다채널 오디오 신호의 인코딩 방법.
  2. 제1항에 있어서,
    상기 N/2개 채널 신호를 생성하는 단계는,
    N/2개 TTO(Two-To-One) 코딩 모듈을 이용하여 N개 채널의 오디오 신호를 다운믹싱함으로써, N/2개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 인코딩 방법.
  3. 제1항에 있어서,
    샘플링율 변환부를 통해 오디오 신호에 대해 샘플링율을 변환하는 단계
    를 더 포함하고,
    상기 샘플링율 변환부는,
    상기 MPS 인코더 이전에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 인코더 이후에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하는 다채널 오디오 신호의 인코딩 방법.
  4. 제3항에 있어서,
    상기 샘플링율을 변환하는 단계는,
    상기 USAC 인코더에 적용되는 비트레이트에 따라 오디오 신호에 대해 샘플링율을 변환하는 다채널 오디오 신호의 인코딩 방법.
  5. 제1항에 있어서,
    상기 N/2개 채널의 오디오 신호를 생성하는 단계는,
    상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하여 N/2개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 인코딩 방법.
  6. 제1항에 있어서,
    상기 N/2개 채널의 오디오 신호를 생성하는 단계는,
    상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하는 다채널 오디오 신호의 인코딩 방법.
  7. USAC 디코더를 통해 N/2개 채널의 오디오 신호의 코어 대역에 대해 디코딩하는 단계; 및
    MPS 디코더를 통해 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 단계
    를 포함하는 다채널 오디오 신호의 디코딩 방법.
  8. 제7항에 있어서,
    상기 N개 채널의 오디오 신호를 생성하는 단계는,
    N/2개 OTT(One-To-Two) 코딩 모듈을 이용하여 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 디코딩 방법.
  9. 제7항에 있어서,
    샘플링율 변환부를 통해 오디오 신호에 대해 샘플링율을 변환하는 단계
    를 더 포함하고,
    상기 샘플링율 변환부는,
    상기 MPS 디코더 이전에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 디코더 이후에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하는 다채널 오디오 신호의 디코딩 방법.
  10. 제9항에 있어서,
    상기 샘플링율을 변환하는 단계는,
    상기 USAC 디코더에 적용되는 비트레이트에 따라 오디오 신호에 대해 샘플링율을 변환하는 다채널 오디오 신호의 디코딩 방법.
  11. 제7항에 있어서,
    상기 N개 채널의 오디오 신호를 생성하는 단계는,
    상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 디코딩 방법.
  12. 제7항에 있어서,
    상기 N개 채널의 오디오 신호를 생성하는 단계는,
    상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱하는 다채널 오디오 신호의 디코딩 방법.
  13. N개 채널의 오디오 신호를 다운믹스하여 N/2개 채널의 오디오 신호를 생성하는 MPS 인코더; 및
    USAC 인코더를 통해 상기 N/2개 채널의 오디오 신호의 코어 대역에 대해 인코딩하는 USAC 인코더
    를 포함하는 다채널 오디오 신호의 인코딩 장치.
  14. 제13항에 있어서,
    오디오 신호에 대해 샘플링율을 변환하는 샘플링율 변환부
    를 더 포함하고,
    상기 샘플링율 변환부는,
    상기 MPS 인코더 이전에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 인코더 이후에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하는 다채널 오디오 신호의 인코딩 장치.
  15. 제13항에 있어서,
    상기 MPS 인코더는,
    상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하여 N/2개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 인코딩 장치.
  16. 제13항에 있어서,
    상기 MPS 인코더는,
    상기 N개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N개 채널의 오디오 신호를 다운믹싱하는 다채널 오디오 신호의 인코딩 장치.
  17. N/2개 채널의 오디오 신호의 코어 대역에 대해 디코딩하는 USAC 디코더; 및
    N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 MPS 디코더
    를 포함하는 다채널 오디오 신호의 디코딩 장치.
  18. 제17항에 있어서,
    상기 MPS 디코더는,
    N/2개 OTT(One-To-Two) 코딩 모듈을 이용하여 N/2개 채널의 오디오 신호를 업믹싱함으로써, N개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 디코딩 장치.
  19. 제17항에 있어서,
    오디오 신호에 대해 샘플링율을 변환하는 샘플링율 변환부
    를 더 포함하고,
    상기 샘플링율 변환부는,
    상기 MPS 디코더 이전에 배치되어 N/2개 채널의 오디오 신호의 샘플링율을 변환하거나, 또는 상기 MPS 디코더 이후에 배치되어 N개 채널의 오디오 신호의 샘플링율을 변환하는 다채널 오디오 신호의 디코딩 장치.
  20. 제17항에 있어서,
    상기 MPS 디코더는,
    상기 N/2개 채널이 MPS 표준에서 정의하는 채널 개수를 초과하는 경우, MPS 인코더에서 지원하는 MPS 표준 동작을 바이패스하고, 임의적인 트리(Arbitrary Tree)에 따라 N/2개 채널의 오디오 신호를 업믹싱하여 N개 채널의 오디오 신호를 생성하는 다채널 오디오 신호의 디코딩 장치.
KR1020150190159A 2014-12-31 2015-12-30 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 KR20160081844A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/540,800 US10529342B2 (en) 2014-12-31 2015-12-31 Method for encoding multi-channel audio signal and encoding device for performing encoding method, and method for decoding multi-channel audio signal and decoding device for performing decoding method
PCT/KR2015/014543 WO2016108655A1 (ko) 2014-12-31 2015-12-31 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
US16/735,522 US11328734B2 (en) 2014-12-31 2020-01-06 Encoding method and encoder for multi-channel audio signal, and decoding method and decoder for multi-channel audio signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20140195783 2014-12-31
KR1020140195783 2014-12-31

Publications (1)

Publication Number Publication Date
KR20160081844A true KR20160081844A (ko) 2016-07-08

Family

ID=56503985

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150190159A KR20160081844A (ko) 2014-12-31 2015-12-30 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치

Country Status (2)

Country Link
US (1) US10529342B2 (ko)
KR (1) KR20160081844A (ko)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1920636B1 (en) 2005-08-30 2009-12-30 LG Electronics Inc. Apparatus and method for decoding an audio signal
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
US8433583B2 (en) 2006-03-29 2013-04-30 Koninklijke Philips International N.V. Audio decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN102077276B (zh) * 2008-06-26 2014-04-09 法国电信公司 多声道音频信号的空间合成
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
ES2592416T3 (es) 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
BR122019023877B1 (pt) * 2009-03-17 2021-08-17 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
RU2586841C2 (ru) * 2009-10-20 2016-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему
KR101710113B1 (ko) 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2014168439A1 (ko) 2013-04-10 2014-10-16 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法

Also Published As

Publication number Publication date
US10529342B2 (en) 2020-01-07
US20180005635A1 (en) 2018-01-04

Similar Documents

Publication Publication Date Title
RU2660638C2 (ru) Устройство и способ для улучшенного пространственного кодирования аудиообъектов
US11955131B2 (en) Apparatus and method for encoding or decoding a multi-channel signal
JP6346278B2 (ja) ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム
US9966080B2 (en) Audio object encoding and decoding
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
RU2659497C2 (ru) Управляемое модулем рендеринга пространственное повышающее микширование
US20200176002A1 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
US10163446B2 (en) Audio encoder and decoder
AU2013301831A1 (en) Encoder, decoder, system and method employing a residual concept for parametric audio object coding
CA3146169A1 (en) Encoding and decoding ivas bitstreams
KR102144332B1 (ko) 다채널 오디오 신호 처리 방법 및 장치
KR20150009474A (ko) 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
US11328734B2 (en) Encoding method and encoder for multi-channel audio signal, and decoding method and decoder for multi-channel audio signal
KR20160081844A (ko) 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
US10225675B2 (en) Multichannel signal processing method, and multichannel signal processing apparatus for performing the method
US20240105192A1 (en) Spatial noise filling in multi-channel codec
ES2856423T3 (es) Decodificador de señal de audio MPEG-SAOC, codificador de señal de audio MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla descendente usando decodificación MPEG-SAOC, y programa informático que usa un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
KR20150011783A (ko) 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment