KR20110022251A - 스테레오 오디오의 부호화, 복호화 방법 및 장치 - Google Patents

스테레오 오디오의 부호화, 복호화 방법 및 장치 Download PDF

Info

Publication number
KR20110022251A
KR20110022251A KR1020090079769A KR20090079769A KR20110022251A KR 20110022251 A KR20110022251 A KR 20110022251A KR 1020090079769 A KR1020090079769 A KR 1020090079769A KR 20090079769 A KR20090079769 A KR 20090079769A KR 20110022251 A KR20110022251 A KR 20110022251A
Authority
KR
South Korea
Prior art keywords
audios
audio
reconstructed
mono
vector
Prior art date
Application number
KR1020090079769A
Other languages
English (en)
Inventor
문한길
정종훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020090079769A priority Critical patent/KR20110022251A/ko
Priority to US12/868,077 priority patent/US8744089B2/en
Publication of KR20110022251A publication Critical patent/KR20110022251A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 일실시예는 스테레오 오디오를 부호화하는 방법에 관한 것으로, 본 발명의 일 실시예는 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 그 최초 모노 오디오들에 대하여 복수 회에 걸쳐 그 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하고, 그 입력 오디오들, 최초 모노 오디오들 및 그 최초 모노 오디오들로부터 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들(transient mono audios) 각각을 복원하기 위해 필요한 부가 정보들을 생성한 후, 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함한다.

Description

스테레오 오디오의 부호화, 복호화 방법 및 장치{Method and apparatus for encoding/decoding stereo audio}
본 발명은 스테레오 오디오를 부호화, 복호화하는 방법 및 장치에 관한 것으로 보다 상세히는 스테레오 오디오의 부호화, 복호화 수행에 필요한 부가 정보의 개수를 최소화하여 스테레오 오디오를 파라메트릭 부호화, 복호화하는 방법 및 장치에 관한 것이다.
일반적으로 멀티 채널 오디오를 부호화하는 방법에는 웨이브폼(waveform) 오디오 코딩과 파라메트릭(parametric) 오디오 코딩이 있다. 웨이브폼 부호화에는
MPEG-2 MC 오디오 코딩, AAC MC 오디오 코딩 및 BSAC/AVS MC 오디오 코딩 등이 있다.
파라메트릭 오디오 코딩에서는 오디오 신호를 주파수, 진폭과 같은 성분으로 분해하고 이러한 주파수, 진폭 등에 대한 정보를 파라미터화하여 오디오 신호를 부호화한다. 파라메트릭 오디오 코딩을 이용해 스테레오 오디오를 부호화하는 경우를 예로 들면, 좌채널 오디오와 우채널 오디오를 다운믹스하여 모노 오디오를 생성하고, 생성된 모노 오디오를 부호화한다. 그런 다음, 모노 오디오를 다시 스테레 오 오디오로 복원하는데 필요한 채널간 세기 차이(IID: Interchannel Intensity Difference), 채널간 상관도(ID: Interchannel Correlation), 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(IPD: Interchannel Phase Difference)에 대한 파라미터를 부호화한다. 여기서, 파리미터는 부가 정보라고 명명될 수도 있다.
좌채널 오디오와 우채널 오디오의 세기를 결정하기 위한 정보로서 채널간 세
기 차이에 대한 파라미터 및 채널간 상관도에 대한 파라미터가 부호화되고, 좌채널
오디오와 우채널 오디오의 위상을 결정하기 위한 정보로서 전위상 차이에 대한 파
라미터 및 채널간 위상 차이에 대한 파라미터가 부호화된다.
본 발명의 목적은 부호화, 복호화 수행에 필요한 부가 정보의 개수를 최소화하여 스테레오 오디오를 파라메트릭 부호화, 복호화하는 방법 및 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 오디오 부호화 방법은 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 상기 최초 모노 오디오들에 대하여 복수 회에 걸쳐 상기 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하는 단계; 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 최초 모노 오디오들로부터 상기 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들(transient mono audios) 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함한다.
바람직하게는 본 발명의 일 실시예에 따른 오디오 부호화 방법은 상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하는 단계; 상기 부호화된 N개의 입력 오디오들을 복호화하는 단계; 및 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 단계를 더 포함하고, 상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화한다.
바람직하게는 상기 부가 정보들을 부호화하는 단계는 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하는 단계; 및 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들각각에서 인접하는 2개의 오디오들 상호간의 위상 차이에 대한 정보를 부호화하는 단계를 포함한다.
바람직하게는 상기 세기를 결정하기 위한 정보를 부호화하는 단계는 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성하는 단계; 상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성하는 단계; 및 상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기 제 3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 단계를 포함한다.
바람직하게는 상기 최종 모노 오디오를 생성하는 단계는 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 전체 개수가 홀수인 경우에는 상기 오디오들 중 하나를 이용하여 2 개의 오디오들을 생성한 후에, 상기 오디들에게 상기 가산 방법을 적용한다.
바람직하게는 상기 최종 모노 오디오를 생성하는 단계, 상기 부가 정보들을 생성하는 단계 및 상기 부가 정보들을 부호화하는 단계는 소정의 주파수 밴드에서 수행된다.
또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 오디오 복호화 방법은 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계; 및 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에게 복수 회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들을 생성하는 단계를 포함하고, 상기 최종 복원 오디오들을 생성하는 단계는 상기 최초 복원 오디오들로부터 상기 최종 복원 오디오들을 생성하는 과정에서 과도 복원 오디오들을 생성한다.
바람직하게는 본 발명의 일실시예에 따른 오디오 복호화 방법은 상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 추출하는 단계를 더 포함하고, 상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성된다.
바람직하게는 상기 복호화된 부가 정보들은 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 인접하는 2개의 복원 오디오들간의 위상 차이에 대한 정보들을 포함한다.
바람직하게는 상기 세기를 결정하기 위한 정보들은 상기 최초 복원 오디오 들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함한다.
바람직하게는 상기 최초 복원 오디오들을 복원하는 단계는 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하는 단계; 상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 및 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및 상기 최초 복원 오디오들의 세기 및 위상에 기초하여, 상기 제1 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제1 최초 복원 오디오를 감산하여 상기 제2 최초 복원 오디오를 복원하고, 상기 제2 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오를 감산하여 상기 제1 최초 복원 오디오를 복원하는 단계를 포함한다.
바람직하게는 상기 최초 복원 오디오들을 복원하는 단계는 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도 에 기초하여 복원된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오와 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오 또는 상기 제1 최초 복원 오디오를 감산하여 생성된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 소정 비율로 조합하여 상기 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 복원한다.
바람직하게는 상기 최초 복원 오디오들을 복원하는 단계는 상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및 상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 오디오 부호화 장치는 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 상기 최초 모노 오디오들에 대하여 복수 회에 걸쳐 상기 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하는 모노 오디오 생성부; 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 최초 모노 오디오들로부터 상기 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 부가 정보 생성부; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 부호화부를 포함한다.
바람직하게는 상기 모노 오디오 생성부는 상기 입력 오디오들, 상기 최초 모 노 오디오들 및 상기 과도 모노 오디오들 각각에서 2개의 인접하는 오디오들을 가산하는 복수 개의 다운 믹스부를 포함한다.
바람직하게는 본 발명의 일실시예에 따른 오디오 부호화 장치는 상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하고, 상기 부호화된 N개의 입력 오디오들을 복호화한 후, 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 차이 값 정보 생성부를 더 포함하고, 상기 부호화부는 상기 차이 값에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화한다.
또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 오디오 복호화 장치는 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 추출부; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 복호화부; 및 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에게 복수 회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들을 생성하는 오디오 복원부를 포함하고, 상기 최종 복원 오디오들을 생성하는 단계는 상기 최초 복원 오디오들로부터 상기 최종 복원 오디오들을 생성하는 과정에서 과도 복원 오디오들을 생성한다.
바람직하게는 상기 오디오 복원부는 상기 부가 정보들에 기초하여, 상기 복호화된 모노 오디오, 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함 한다.
바람직하게는 상기 추출부는 상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 더 추출하고, 상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성된다.
또한, 본 발명의 일실시예는 상기 목적을 달성하기 위하여 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 상기 최초 모노 오디오들에 대하여 복수 회에 걸쳐 상기 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하는 단계; 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 최초 모노 오디오들로부터 상기 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들(transient mono audios) 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함하는 오디오 부호화 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
또한, 본 발명의 다른 실시예는 상기 목적을 달성하기 위하여 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계; 및 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에게 복수 회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들을 생성하는 단계를 포함하고, 상기 최종 복원 오디오들을 생성하는 단계는 상기 최초 복원 오디오들로부터 상기 최종 복원 오디오들을 생성하는 과정에서 과도 복원 오디오들을 생성하는 오디오 복호화 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.
도 1은 본 발명에 따른 오디오 부호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 오디오 부호화 장치는 모노 오디오 생성부(110), 부가 정보 생성부(120) 및 부호화부(120)를 포함한다.
모노 오디오 생성부(110)는 N개 채널의 입력 오디오들(Ch1 내지 Chn)을 수신하고, 그 수신된 N개 채널의 입력 오디오들(Ch1 내지 Chn)에서 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들(Beginning Mono Audios:BM)을 생성하고, 그 최초 모노 오디오들(BM1 내지 BMm)에 대하여 복수 회에 걸쳐 그 최초 모노 오디오들(BM1 내지 BMm) 생성에 적용된 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오(Final Mono Audio:FM)를 생성한다.
여기서, 최초 모노 오디오들(BM1 내지 BMm)을 생성할 때 2개의 오디오 단위로 오디오들을 가산하고 있으므로, 최초 모노 오디오들(BM1 내지 BMm)에 대한 복수 회에 걸친 가산들도 2개의 오디오 단위로 오디오들을 가산하게 된다. 또한, 후술하는바와 같이 최초 모노 오디오들(BM1 내지 BMm)을 생성할 때 입력 오디오들(Ch1 내지 Chn)에서 인접하는 2개의 입력 오디오의 위상을 동일하게 조절한 후에 가산하였다면, 최초 모노 오디오들(BM1 내지 BMm)에 대한 복수 회에 걸친 가산들도 인접하는 2개의 오디오들의 위상을 동일하게 조절한 후에 가산하게 된다.
이때, 모노 오디오 생성부(110)는 최초 모노 오디오들(BM)로부터 최종 모노 오디오(FM)를 생성하는 과정에서 복수개의 과도 모노 오디오들(Transient Mono Audios:TM)을 생성하게 된다.
또한, 도 1에 도시된 것과 같이 모노 오디오 생성부(110)는 입력 오디오들(Ch1 내지 Chn), 최초 모노 오디오들(BM1 내지 BMm) 및 과도 모노 오디오들(TM1 내지 TMj) 각각에서 2개의 인접하는 오디오들을 가산하는 복수개의 다운 믹스부를 포함하고, 이와 같은 복수개의 다운 믹스부를 통하여 최종 모노 오디오(FM)를 생성하게 된다.
예컨대, 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)를 입력받은 다운 믹스부는 그 입력된 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)를 가산하여 제1 최초 모노 오디오(BM1)를 생성한다. 다음으로, 제1 최초 모노 오디오(BM1)와 제2 최초 모노 오디오(BM2)를 입력받은 다운 믹스부는 제1 과도 모노 오디오(TM1)를 생성하게 된다.
이때, 다운 믹스부들은 2개의 인접하는 오디오들을 가산할 때 2개의 인접하는 오디오들을 그대로 가산하지 않고, 2개의 오디오들 중 하나의 오디오의 위상을 다른 하나의 오디오의 위상과 동일하게 조절한 후에 가산할 수 있다. 예컨대, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)를 가산할 때, 제2 채널 입력 오디오(Ch2)의 위상을 제1 채널 입력 오디오(Ch1)의 위상과 동일하게 조절한 후에, 그와 같이 위상이 조절된 제2 채널 입력 오디오(Ch2)를 제1 채널 입력 오디오(Ch1)와 가산하게 된다. 이에 대한 구체적인 내용은 후술한다.
한편, 본 실시예에서는 모노 오디오 생성부(110)에 입력되는 입력 오디오들(Ch1 내지 Chn)이 디지털 신호인 것으로 가정하였으나, 다른 실시예에서는 입력 오디오들(Ch1 내지 Chn)이 아날로그 신호인 경우에는 모노 오디오 생성부(110)에 입력되기 전에, N개 채널의 입력 오디오들에 대하여 샘플링 및 양자화를 수행하여 디지털 신호로 변환하는 과정이 더 수행될 수 있다.
부가 정보 생성부(120)는 입력 오디오들(Ch1 내지 Chn), 최초 모노 오디오들(BM1 내지 BMm) 및 과도 모노 오디오들(TM1 내지 TMj) 각각을 복원하기 위해 필요한 부가 정보들을 생성한다.
이때, 부가 정보 생성부(120)는 모노 오디오 생성부(110)에 포함된 다운 믹스부들이 인접하는 2개의 오디오들을 가산할 때마다, 그 가산에 의하여 생성된 오디오로부터 상호간에 가산된 그 2개의 오디오들을 복원하기 위하여 필요한 부가 정보들을 생성하게 된다. 다만, 도 1에서는 설명의 편의를 위하여 각각의 다운 믹스부로부터 부가 정보 생성부(120)에 입력되는 부가 정보들은 도시하지 않았다.
이때, 부가 정보들은 입력 오디오들(Ch1 내지 Chn), 최초 모노 오디오들(BM1 내지 BMm) 및 과도 모노 오디오들(TM1 내지 TMj) 각각의 세기(intentsity)를 결정하기 위한 정보와 그 오디오들 각각에서 인접하는 2개의 오디오들 상호간의 위상 차이에 대한 정보를 포함한다. 여기서, 인접하는 2개의 오디오들 상호간의 위상 차이는 하나의 다운 믹스부에서 가산되는 2개의 오디오들 상호간의 위상 차이를 말한다.
한편, 다른 실시예에서는 다운 믹스부들 각각에 부가 정보 생성부(120)가 탑재되어, 다운 믹스부들이 인접하는 2개의 오디오들을 가산함과 동시에 그 2개의 오디오들에 대한 부가 정보들을 생성할 수도 있다.
부가 정보 생성부(120)가 부가 정보들을 생성하는 방법에 대한 구체적인 설명은 도 2 내지 도 4를 참조하여 상세히 설명한다.
부호화부(130)는 모노 오디오 생성부(110)를 통하여 생성된 최종 모노 오디오(FM)와 부가 정보 생성부(120)를 통하여 생성된 부가 정보들을 부호화한다.
이때, 최종 모노 오디오(FM)와 부가 정보들을 부호화하는 방법에는 제한이 없으며, 모노 오디오 및 부가 정보를 부호화하는데 사용되는 일반적인 부호화 방법에 의해 부호화할 수 있다.
한편, 다른 실시예에서는 본 발명의 일실시예에 따른 오디오 부호화 장치는 N개의 입력 오디오들(Ch1 내지 Chn)을 부호화하고, 그 부호화된 N개의 입력 오디오들(Ch1 내지 Chn)을 복호화한 후에 그 복호화된 N개의 입력 오디오들(Ch1 내지 Chn)과 수신되는 N개의 원본 입력 오디오들(Ch1 내지 Chn)의 차이 값들에 대한 정 보를 생성하는 차이 값 정보 생성부(미도시)를 더 포함할 수 있다.
이와 같이 본 발명의 일실시예에 따른 오디오 부호화 장치가 차이 값 정보 생성부를 더 포함하는 경우에는, 부호화부(130)는 최종 모노 오디오(FM) 및 부가 정보들과 함께 차이 값 정보를 부호화할 수 있다. 이와 같은 차이 값 정보는 본 발명의 일실시예에 따른 오디오 부호화 장치에 의하여 생성된 부호화된 모노 오디오가 복호화되면, 그 복호화된 모노 오디오에 가산됨으로써 N개의 원본 입력 오디오들(Ch1 내지 Chn)에 보다 가까운 오디오들을 생성할 수 있게 해준다.
한편, 또 다른 실시예에서는 본 발명의 일 실시예에 따른 오디오 부호화 장치가 부호화부(130)를 통하여 부호화된 최종 모노 오디오(FM)와 부가 정보들을 다중화하여 최종 비트 스트림을 생성하는 다중화부(미도시)를 더 포함할 수 있다.
이하에서는 부가 정보들을 생성하는 방법 및 그와 같이 생성된 부가 정보를 부호화하는 방법에 대하여 상세히 설명한다. 다만, 설명의 편의를 위하여 모노 오디오 생성부(110)에 포함된 다운 믹스부가 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)를 입력받아 제1 최초 모노 오디오(BM1)를 생성하는 과정에서 생성되는 부가 정보들에 대해서 설명하도록 한다. 또한, 이하에서는 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보를 생성하는 경우와 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보를 생성하는 경우에 대하여 나누어 설명하도록 한다.
(1) 세기를 결정하기 위한 정보
파라메트릭 오디오 코딩에서는 각각의 채널 오디오를 주파수 도메인으로 변
환하여 주파수 도메인에서 채널 오디오 각각의 세기 및 위상에 대한 정보를 부호화한다. 도 2를 참조하여 상세히 설명한다.
도 2는 파라메트릭 오디오 코딩에서의 서브 밴드들을 도시한다.
도 2는 오디오 신호를 주파수 도메인으로 변환한 주파수 스펙트럼을 도시한
다. 오디오 신호를 고속 퓨리에 변환(Fast Fourier Transform)하면, 오디오 신호
는 주파수 도메인에서 이산(discrete)된 값들에 의해 표현될 수 있다. 즉, 오디오
신호는 복수의 정현파들의 합으로 표현될 수 있다.
파라메트릭 오디오 코딩에서는 오디오 신호가 주파수 도메인으로 변환되면,
주파수 도메인을 복수의 서브 밴드들로 분할하고, 각각의 서브 밴드들에서의 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보 및 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보를 부호화한다. 이때, 서브 밴드 k에서의 세기 및 위상에 대한 부가 정보들을 부호화한 후에, 마찬가지로 서브 밴드 k+1에서의 세기 및 위상에 대한 부가 정보들을 부호화한다. 파라메트릭 오디오 코딩에서는 이와 같은 방식으로 전체 주파수 밴드를 복수의 서브 밴드들로 분할하고, 각각의 서브 밴드에 대하여 스테레오 오디오 부가 정보를 부호화한다.
이하에서는 N개 채널의 입력 오디오를 가진 스테레오 오디오의 부호화, 복호화와 관련하여 소정의 주파수 밴드 즉, 서브 밴드 k에서 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)에 대한 부가 정보를 부호화하는 경우를 예로 들어 설명한다.
종래 기술에 따른 파라메트릭 오디오 코딩에서 스테레오 오디오에 대한 부가 정보들을 부호화할 때에는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 정보로서 채널간 세기 차이(IID: Interchannel Intensity Difference) 및 채널간 상관도(IC: Interchannel Correlation)에 대한 정보를 부호화함은 전술하였다. 이때, 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 세기 및 제2 채널 입력 오디오(Ch2)의 세기를 각각 계산하고, 제1 채널 입력 오디오(Ch1)의 세기와 제2 채널 입력 오디오(Ch2)의 세기 사이의 비율을 채널간 세기 차이(IID)에 대한 정보로서 부호화한다. 그러나 두 채널 오디오의 세기 사이의 비율만으로는 복호화하는 측에서 제1 채널 입력 오디오(Ch1)의 세기 및 제2 채널 입력 오디오(Ch2)의 세기를 결정할 수 없으므로, 부가 정보로써 채널간 상관도(IC)에 대한 정보도 함께 부호화하여 비트스트림에 삽입한다.
본 발명의 일실시예에 따른 오디오 부호화 방법은 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보로서 부호화되는 부가 정보들의 개수를 최소화하기 위하여 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 세기에 대한 벡터 및 제2 채널 입력 오디오(Ch2)의 세기에 대한 벡터를 이용한다. 여기서 제1 채널 입력 오디오(Ch1)를 주파수 도메인으로 변환한 주파수 스펙트럼에서 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 세기이고, 후술하는 벡터 Ch1의 크기이다.
마찬가지로, 제2 채널 입력 오디오(Ch2)를 주파수 도메인으로 변환한 주파수 스펙트럼의 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 k에서 제2 채널 입력 오디오(Ch2)의 세기이고, 후술하는 벡터 Ch2의 크기이다. 도 3a 및 3b를 참조하여 상세히 설명한다.
도 3a는 본 발명에 따라 제1 채널 입력 오디오 및 제2 채널 입력 오디오의 세기에 대한 정보를 생성하는 방법의 일실시예를 설명하기 위하여 도시한 도면이다.
도 3a를 참조하면, 본 발명의 일실시예에 따른 부가 정보 생성부(120)는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 세기에 대한 벡터인 Ch1 벡터와 제2 채널 입력 오디오(Ch2)의 세기에 대한 벡터인 Ch2벡터가 소정의 각도를 이루도록 2차원 벡터 공간을 생성한다. 만일, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)가 좌측 오디오 및 우측 오디오라면, 스테레오 오디오의 청취자가 좌측 음원 방향과 우측 음원 방향이 60도의 각도를 이루는 위치에서 스테레오 오디오를 청취하는 것을 가정하고 스테레오 오디오를 부호화하는 것이 일반적이므로, 2차원 벡터 공간에서 Ch1벡터와 Ch2 벡터 사이의 각도(θ0)를 60 도로 설정할 수 있다. 하지만, 본 실시예에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)는 좌측 오디오 및 우측 오디오가 아니므로, Ch1벡터와 Ch2 벡터는 임의의 각도(θ0)를 가질 것이다.
도 3a에서는 Ch1벡터와 Ch2 벡터가 가산되어 생성된 제1 최초 모노 오디오(BM1)의 세기에 대한 벡터인 BM1 벡터가 도시되어 있다. 이때, 전술한 바와 같이 만일 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)가 각각 좌측 오디오와 우측 오디오에 대응된다면, 좌측 음원 방향과 우측 음원 방향이 60도의 각도를 이루는 위치에서 스테레오 오디오를 청취하는 청취자는 BM1 벡터의 방향으로 BM1 벡터의 크기에 해당하는 세기의 모노 오디오를 청취하게 된다.
본 발명의 일실시예에 따른 부가 정보 생성부(120)는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보로써 채널간 세기 차이(IID)에 대한 정보와 채널간 상관도(IC)에 대한 정보 대신에 BM1 벡터와 Ch1 벡터 사이의 각도(θq) 또는 BM1 벡터와 Ch2 벡터 사이의 각도(θp)에 대한 정보를 생성한다.
또한, 부가 정보 생성부(120)는 BM1 벡터와 Ch1 벡터 사이의 각도(θq) 또는 BM1 벡터와 Ch2 벡터 사이의 각도(θp)를 생성하는 대신에 cos θq 또는 cos θp와 같이 코사인 값을 생성할 수도 있다. 이는, 각도에 대한 정보를 생성하고 그 생성된 각도에 대한 정보를 부호화하려면, 양자화 과정을 거쳐야 하는데 양자화 과정에서 발생하는 손실을 최소화하기 위해 각도의 코사인 값을 생성하여 부호화하기 위한 것이다.
도 3b는 본 발명에 따른 제1채널 입력 오디오 및 제2채널 입력 오디오의 세기에 대한 정보를 생성하는 방법의 제2 실시예를 설명하기 위하여 도시한 도면이다.
도 3b는 도 3a에서의 벡터 각도를 정규화하는 과정을 도시한 도면이다.
도 3a에서와 같이 Ch1 벡터와 Ch2 벡터 사이의 각도(θ0)가 90 도가 아닌 경우에는 θ0을 90 도로 정규화 할 수 있고, 이때 θp 또는 θq도 정규화된다.
도 3b에서 BM1 벡터와 Ch2 벡터 사이의 각도(θp)에 대한 정보를 정규화해서 나타내면, θ0이 90 도로 정규화되면 이에 대응하여 θp도 정규화되어 θm=(θp × 90)/θ0가 계산된다. 부가 정보 생성부(120)는 정규화되지 않은 θp 또는 정규화된 θm을 제1 채널 입력 오디오(Ch1)의 세기 및 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보로서 생성할 수 있다. 또한, 부가 정보 생성부(120)는 θp 또는 θm 대신에, cos θp 또는 cos θm을 제1 채널 입력 오디오(Ch1)의 세기 및 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보로서 생성할 수 있다.
(2) 위상을 결정하기 위한 정보
종래 기술에 따른 파라메트릭 오디오 코딩에서는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보로서 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(Interchannel Phase Difference)에 대한 정보를 부호화하였음은 전술하였다.
즉, 종래에는 도 2에 도시된 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)를 가산하여 생성된 제1 최초 모노 오디오(BM1)와 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 위상 차이를 계산하여 전 위상 차이에 대한 정보를 생성하여 부호화하고, 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상 차이를 계산하여 채널간 위상 차이에 대한 정보를 생성하고 부호화하였다. 위상 차이는 서브 밴드에 포함된 주파수 f1, f2, ... , fn 에서의 위상 차이들을 각각 계산한 후에 계산된 위상 차이들의 평균을 계산함으로써 구할 수 있다.
그러나, 본 발명의 일실시예에 따른 오디오 부호화 방법에서 부가 정보 생성 부(120)는 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보로서 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2) 사이의 위상 차이에 대한 정보만을 생성한다.
본 발명의 일실시예에서는 다운믹스부가 제1 채널 입력 오디오(Ch1)의 위상과 동일해지도록 제2 채널 입력 오디오(Ch2)의 위상을 조절하여 위상 조절된 제2 채널 입력 오디오(Ch2)를 생성하고, 그 위상 조절된 제2 채널 입력 오디오(Ch2)를 제1 채널 입력 오디오(Ch1)와 가산하기 때문에, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2) 사이의 위상 차이에 대한 정보만 가지고도 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2) 각각의 위상을 계산할 수 있게 된다.
서브 밴드 k의 오디오를 예로 들어 설명하면, 주파수 f1, f2, ... , fn에서 제2 채널 입력 오디오(Ch2)의 위상을 주파수 f1, f2, ... , fn에서 제1 채널 입력 오디오(Ch1)의 위상과 동일해지도록 각각 조절한다. 주파수 f1에서 제1 채널 입력 오디오(Ch1)의 위상을 조절하는 경우를 예로 들어 설명하면, 주파수 f1에서 제1 채널 입력 오디오(Ch1)가 |Ch1|ei(2πf1t+θ1)로 표시되고, 제2 채널 입력 오디오(Ch2)가 |Ch2|ei(2πf1t+θ2)로 표시되면, 주파수 f1에서 위상 조절된 제2 채널 입력 오디오(Ch2')는 다음 수학식 1에 의해 구해질 수 있다. 여기서, θ1은 주파수 f1에서 제1 채널 입력 오디오(Ch1)의 위상이고, θ2는 주파수 f1에서 제2 채널 입력 오디오(Ch2)의 위상이다.
Ch2' = Ch2 × ei(θ1-θ2) = |Ch2|ei(2πf1t+θ1)
수학식 1에 의해 주파수 f1에서 제2 채널 입력 오디오(Ch2)는 위상이 조절되어 제1 채널 입력 오디오(Ch1)의 위상과 동일해진다. 이와 같은 위상 조절은 서브 밴드 k의 다른 주파수들 즉, f2, f3, ... , fn에서 제2 채널 입력 오디오(Ch2)에 대해 반복하여 서브 밴드 k에서 위상 조절된 제2 채널 입력 오디오(Ch2)를 생성한다.
서브 밴드 k에서 위상 조절된 제2 채널 입력 오디오(Ch2)는 제1 채널 입력 오디오(Ch1)의 위상과 동일하므로, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상 차이만 부호화하면 최초 모노 오디오(BM1)를 복호화하는 측에서 제2 채널 입력 오디오(Ch2)의 위상을 구할 수 있다. 또한, 제1 채널 입력 오디오(Ch1)의 위상과 다운믹스부에서 생성된 최초 모노 오디오(BM1)의 위상은 동일하므로, 별도로 제1 채널 입력 오디오(Ch1)의 위상에 대한 정보를 부호화할 필요가 없다.
따라서, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상 차이에 대한 정보만을 부호화하면, 복호화하는 측에서는 그 부호화된 정보를 이용하여 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)의 위상을 계산할 수 있게 된다.
한편, 전술한 서브 밴드 k에서 채널 오디오들의 세기 벡터를 이용해 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보를 부호화하는 방법과, 위상 조절을 이용해 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보를 부호화하는 방법은 각각 독립적으로 이용될 수도 있고 조합되어 이용될 수 있다. 다시 말해, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보는 본 발명에 따라 벡터를 이용해 부호화하고, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보는 종래 기술과 같이 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(Interchannel Phase Difference)를 부호화할 수 있다. 반대로, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보는 종래 기술에 따라 채널간 세기 차이(IID: Interchannel Intensity Difference) 및 채널간 상관도(IC: Interchannel Correlation)를 이용해 부호화하고, 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보만 본 발명과 같이 위상 조절을 이용해 부호화할 수도 있다. 물론, 본 발명에 따른 두 가지 방법을 모두 사용하여 부가 정보들을 부호화할 수도 있다.
도 4는 본 발명에 따라 부가 정보들을 부호화하는 방법에 대한 일실시예를 설명하기 위하여 도시한 흐름도이다.
도 4는 본 발명에 따라 소정의 주파수 밴드 즉, 서브 밴드 k에서 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)의 세기 및 위상에 대한 정보를 부호화하는 방법을 설명한다.
단계 410에서는, 부가 정보 생성부(120)가 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 세기에 대한 제1 벡터 및 제2 채널 입력 오디오(Ch2)의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성한다.
이때, 부가 정보 생성부(120)는 서브 밴드 k에서의 제1 채널 입력 오디오(Ch1)의 세기 및 제2 채널 입력 오디오(Ch2)의 세기에 기초하여 도 3a에 도시된 벡터 공간을 생성한다.
단계 420에서, 부가 정보 생성부(120)는 단계 410에서 생성된 벡터 공간에서 제1 벡터와 제2 벡터를 가산하여 생성된 최초 모노 오디오(BM1)의 세기에 대한 벡터인 제3 벡터와 제1 벡터 사이의 각도 또는 제3 벡터와 제2 벡터 사이의 각도에 대한 정보를 생성한다.
여기서, 각도에 대한 정보는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보이다. 또한, 각도에 대한 정보는 각도 자체가 아닌 각도의 코사인 값에 대한 정보일 수 있다.
이때, 최초 모노 오디오(BM1)는 제1 채널 입력 오디오(Ch1)와 원본 제2 채널 입력 오디오(Ch2)를 가산한 오디오일 수도 있고, 제1 채널 입력 오디오(Ch1)와 위상 조절된 제2 채널 입력 오디오(Ch2)를 가산한 오디오일 수도 있다. 여기서, 위상 조절된 제2 채널 입력 오디오(Ch2)의 위상은 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)의 위상과 동일하다.
단계 430에서, 부가 정보 생성부(120)는 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2) 사이의 위상 차이에 대한 정보를 생성한다.
단계 440에서는, 부호화부(130)는 제3 벡터와 제1 벡터 사이의 각도 또는 제 3 벡터와 제2 벡터 사이의 각도에 대한 정보와 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2) 사이의 위상 차이에 대한 정보를 부호화한다.
지금까지 도 2 내지 도 4에서 설명한 부가 정보 생성 방법 및 부호화 방법은, 도 1에 도시된 입력 오디오들(Ch1 내지 Chn), 최초 모노 오디오들(BM1 내지 BMm) 및 과도 모노 오디오들(TM1 내지 TMj) 각각에서 상호간에 가산되는 2개의 오디오들을 복원하기 위한 부가 정보들을 생성할 때에도 동일하게 적용될 수 있다.
도 5는 본 발명에 따른 오디오 부호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.
단계 510에서는, 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 그 최초 모노 오디오들에 대하여 복수 회에 걸쳐 그 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성한다.
단계 520에서는, 입력 오디오들, 최초 모노 오디오들 및 과도 모노 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성한다.
단계 530에서는, 최종 모노 오디오와 부가 정보들을 부호화한다.
도 6은 본 발명에 따른 오디오 복호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 6을 참조하면, 본 발명의 일실시예에 따른 오디오 복호화 장치는 추출부(610), 복호화부(620) 및 오디오 복원부(630)를 포함한다.
추출부(610)는 수신된 오디오 데이터로부터 부호화된 모노 오디오(Encoded Mono Audio:EM)와 부호화된 부가 정보들(Encoded Side Information:ES)을 추출한다. 이때, 추출부(610)는 역다중화부로 명명될 수도 있다.
다만, 다른 실시예에서는 오디오 데이터 대신 부호화된 모노 오디오(EM) 및 부호화된 부가 정보들(ES)이 수신될 수 있는데, 이 경우에는 추출부(610)가 생략될 수 있다.
복호화부(620)는 추출부(610)를 통하여 추출된 부호화된 모노 오디오(EM)와 부호화된 부가 정보들(ES)을 복호화한다.
오디오 복원부(630)는 복호화된 부가 정보들(Decoded Side Information:DS)에 기초하여, 복호화된 모노 오디오(Decoded Mono Audio:DM)로부터 2개의 최초 복원 오디오들(Beginning Restored Audios:BR)을 복원하고, 2개의 최초 복원 오디오들(BR1, BR2) 각각에게 복수 회에 걸쳐 그 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들(Ch1 내지 Chn) 을 생성한다.
이때, 오디오 복원부(630)는 최초 복원 오디오들(BR1, BR2)로부터 최종 복원 오디오들(Ch1 내지 Chn)을 생성하는 과정에서 과도 복원 오디오들(Transient Restored Audios:TR)을 생성한다.
또한, 도 6에 도시된 것과 같이 오디오 복원부(630)는 최초 복원 오디오들(BR1, BR2) 및 과도 복원 오디오들(TR1 내지 TRs+m) 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함하고, 이와 같은 복수개의 업 믹스부들을 통하여 최종 복원 오디오들(Ch1 내지 Chn)을 생성하게 된다.
도 6에서는 복호화부(620)를 통하여 복호화된 부가 정보들(DS)이 오디오 복 원부(630)에 포함된 모든 업 믹스부에 전송되지만, 설명의 편의를 위하여 각각의 업믹스부에 전송되는 복호화된 부가 정보들(DS)에 대해서는 도시하지 않았다. 한편, 다른 실시예에서 추출부(610)가 오디오 데이터로부터 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 그 N개의 원본 오디오들간의 차이 값들에 대한 정보를 더 추출한 경우에는, 복호화부(620)를 통하여 그 차이 값들에 대한 정보를 복호화한 후에, 그 복호화된 차이 값들에 대한 정보를 오디오 복원부(630)를 통하여 생성된 최종 복원 오디오들(Ch1 내지 Chn) 각각에 가산할 수 있다. 이를 통하여, N개의 원본 입력 오디오들(Ch1 내지 Chn)에 보다 가까운 오디오를 얻을 수 있게 된다.
이하에서는 보다 구체적으로 업 믹스부의 동작을 설명한다. 다만, 설명의 편의를 위하여 s+1번째 과도 복원 오디오(TRs+1)를 입력받아 제1 채널 입력 오디오(Ch1) 및 제2 채널 입력 오디오(Ch2)를 최종 복원 오디오들로서 복원하는 업 믹스부의 동작에 대하여 설명하도록 한다.
도 3a에 도시된 벡터 공간을 예로 들어 설명하면, 업 믹스부는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보로서 s+1번째 과도 복원 오디오(TRs+1)의 세기에 대한 벡터인 BM1 벡터가 제1 채널 입력 오디오(Ch1)의 세기에 대한 벡터인 Ch1 벡터 또는 제2 채널 입력 오디오(Ch2)의 세기에 대한 벡터인 Ch2 벡터와 이루는 각도에 대한 정보를 이용한다. 바람직하게는 BM1 벡터와 Ch1 벡터 사이의 각도의 코사인 값 또는 BM1 벡터와 Ch2 벡터 사이의 각도의 코사인 값에 대한 정보를 이용할 수 있다.
도 3b의 예에서는 Ch1 벡터와 Ch2 벡터 사이의 각도(θ0)가 60도라고 가정하면 제1 채널 입력 오디오(Ch1)의 세기, 즉 Ch1 벡터의 크기는 |Ch1|=|BM1|×sin θm/cos(π/12)에 의해 계산될 수 있다. 여기서, |BM1|은 s+1번째 과도 복원 오디오(TRs+1)의 세기 즉, BM1 벡터의 크기이고, Ch1 벡터와 Ch1' 벡터 사이의 각도는 15 도이다. 마찬가지로 Ch1 벡터와 Ch2 벡터 사이의 각도(θ0)가 60도라고 가정하면 제2 채널 입력 오디오(Ch2)의 세기 즉, Ch2 벡터의 크기는 |Ch2|=|BM1|×cos θm/cos (π/12)에 의해 계산될 수 있음은 당업자에게 자명하다. 다만, 여기서는 Ch2 벡터와 Ch2' 벡터 사이의 각도가 15 도인 경우를 예로 들었다.
또한, 업 믹스부는 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보로서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상 차이에 대한 정보를 이용할 수 있다. s+1번째 과도 복원 오디오(TRs+1)를 부호화할 때에 제1 채널 입력 오디오(Ch1)의 위상과 동일해지도록 제2 채널 입력 오디오(Ch2)의 위상을 이미 조절한 경우에는 업 믹스부가 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상 차이에 대한 정보만을 이용해서 제1 채널 입력 오디오(Ch1)의 위상 및 제2 채널 입력 오디오(Ch2)의 위상을 계산할 수 있다.
한편, 전술한 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 세기를 결정하기 위한 정보를 벡터를 이용해 복호화하는 방법과, 서브 밴드 k에서 제1 채널 입력 오디오(Ch1)와 제2 채널 입력 오디오(Ch2)의 위상을 결정하기 위한 정보를 위상 조절을 이용해 복호화하는 방법은 각각 독립적으로 이용될 수도 있고 조합되어 함께 이용될 수도 있다.
도 7은 본 발명에 따른 오디오 복호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.
단계 710에서, 수신된 오디오 데이터로부터 부호화된 모노 오디오(EM)와 부호화된 부가 정보들(ES)을 추출한다.
단계 720에서, 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화한다.
단계 730에서, 그 복호화된 부가 정보들(DS)에 기초하여, 복호화된 모노 오디오(DM)로부터 2개의 최초 복원 오디오들(BR1, BR2)을 복원하고, 그 2개의 최초 복원 오디오들(BR1, BR2) 각각에게 복수 회에 걸쳐 그 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들(Ch1 내지 Chn)을 생성한다.
이때, 최초 복원 오디오들(BR1, BR2)로부터 최종 복원 오디오들(Ch1 내지 Chn)을 생성하는 과정에서 과도 복원 오디오들(TR1 내지 TRs+m)이 생성된다.
한편, 다른 실시예에서는 최종 복원 오디오들(Ch1 내지 Chn)이 생성되면, 그 생성된 최종 복원 오디오들(Ch1 내지 Chn)을 아날로그 신호로 변환하여 출력하는 과정이 더 수행될 수 있다.
도 8은 본 발명의 일실시예에 따른 오디오 부호화 방법을 5.1채널 스테레오 오디오에 적용한 경우에 대한 실시예이다.
도 8을 참조하면, 입력 오디오들은 좌채널 전방 오디오(L), 좌채널 후방 오 디오(Ls), 중앙 오디오(C), 서브 우퍼 오디오(Sw), 우채널 전방 오디오(R) 및 우채널 후방 오디오(Rs)로 구성된다.
모노 오디오 생성부(810)의 동작은 다음과 같다.
제1 다운 믹스부(811)는 L과 Ls를 가산하여 LV1을 생성하고, 제2 다운 믹스부(812)는 C와 Sw를 가산하여 CSw를 생성하고, 제3 다운 믹스부(813)는 R과 Rs를 가산하여 RV1을 생성한다.
이때, 다운 믹스부들(811 내지 813)은 입력되는 2개의 오디오들을 가산할 때, 2개의 오디오들의 위상이 동일해지도록 위상을 조절한 후에 가산할 수 있다.
한편, 제2 다운 믹스부(812)는 CSw를 생성한 후에 CSw를 분할하여 Cl과 Cr을 생성한다. 이는, 후속하는 다운 믹스부들(814, 815)에 입력될 오디오의 개수가 3개로서 홀수이므로, 제2 다운 믹스부(812)가 CSw를 2개로 분할함으로써 후속하는 다운 믹스부들(814, 815)에게 2개씩의 오디오들이 입력되게 하기 위한 것이다. 이때, Cl과 Cr의 크기는 CSw에 0.5를 곱한 크기를 가지게 되는데, Cl과 Cr의 크기는 이에 한정되지 않고 다른 값으로 결정될 수 있다.
제4 다운 믹스부(814)는 LV1과 Cl을 가산하여 LV2를 생성하고, 제5 다운 믹스부(815)는 RV1과 Cr을 가산하여 RV2를 생성한다.
제6 다운 믹스부(814)는 LV2와 RV2를 가산하여 최종 모노 오디오(Final Mono Audio:FM)를 생성한다.
여기서, LV1, RV1 및 CSw는 전술한 최초 모노 오디오들(BM)에 대응되고, LV2 및 RV2는 전술한 과도 모노 오디오들(TM)에 대응된다.
부가 정보 생성부(820)는 다운 믹스부들(811 내지 816)로부터 부가 정보들(SI1 내지 SI6)을 수신하거나, 그 부가 정보들(SI1 내지 SI6)을 다운 믹스부들(811 내지 816)로부터 독출한 후 그 부가 정보들(SI1 내지 SI6)을 부호화부(830)에 출력한다. 여기서, 도 8에서 도시된 점선은 부가 정보들이 다운 믹스부들(811 내지 816)로부터 부가 정보 생성부(820)에 전송되는 것을 나타내는 것이다.
부호화부(830)는 최종 모노 오디오(FM) 및 부가 정보들(SI1 내지 SI6)을 부호화한다.
도 9는 본 발명의 일실시예에 따른 오디오 복호화 방법을 이용하여 5.1채널 스테레오 오디오를 복호화하는 경우에 대한 실시예이다.
도 9에서 추출부(910) 및 복호화부(920)의 동작은 도 6의 추출부(610) 및 복호화부(620)의 동작과 동일하므로 설명을 생략하고, 이하에서는 오디오 복원부(930)의 동작에 대하셔 상세히 설명한다.
제1 업 믹스부(931)는 복호화된 모노 오디오(DM)로부터 LV2 및 RV2를 복원한다.
이때, 제1 업 믹스부(931)를 포함하는 업 믹스부들(931 내지 936)은 복호화부(920)로부터 입력받은 복호화된 부가 정보들(SI1 내지 SI6)에 기초하여 복원을 수행한다.
제2 업 믹스부(932)는 LV2로부터 LV1과 Cl을 복원하고, 제3 업 믹스부(933)는 RV2로부터 RV1과 Cr을 복원한다.
제4 업 믹스부(934)는 LV1으로부터 L과 Ls를 복원하고, 제5업 믹스부(935)는 Cl과 Cr이 결합되어 생성된 CSw로부터 C와 Sw를 복원하고, 제6업 믹스부(936)는 RV1으로부터 R과 Rs를 복원한다.
여기서, LV2 및 RV2는 전술한 최초 복원 오디오들(BR)에 대응되고, LV1, CSw 및 RV1은 전술한 과도 복원 오디오들(TR)에 대응된다.
이하에서는 도 9에 도시된 업 믹스부들(931 내지 936)이 오디오를 복원하는 방법에 대하여 상세히 설명한다. 이하에서는 도 10을 참조하여 제4 업 믹스부(934)의 동작에 대하여 상세히 설명하도록 한다.
도 10은 본 발명에 따른 업 믹스부의 동작의 일실시예를 설명하기 위하여 도시한 도면이다.
도 10을 참조하면, 서브 밴드 k에서 좌채널 전방 오디오(L)의 세기에 대한 L벡터와 , 좌채널 후방 오디오(Ls)의 세기에 대한 Ls 벡터가 90도를 이루도록 2차원 벡터 공간이 생성되어 있고, 좌채널 전방 오디오(L)와 좌채널 후방 오디오(Ls)가 가산되어 생성된 최초 모노 오디오(LV1)의 세기에 대한 LV1 벡터가 함께 도시되어 있다.
이하에서는 좌채널 전방 오디오(L)와 및 좌채널 후방 오디오(Ls)를 복원하는데 사용될 수 있는 다양한 방법들을 설명한다.
첫 번째 방법은, 전술한 방법에 따라 LV1 벡터와 Ls 벡터간의 각도를 이용하여 좌채널 전방 오디오(L)와 좌채널 후방 오디오(Ls)를 복원하는 방법이다. 즉, 벡터 Ls의 크기를 |LV1|cosθm으로 계산하고, 벡터 L의 크기를 |LV1|sinθm으로 계산함으로써 좌채널 전방 오디오(L)의 세기와 좌채널 후방 오디오(Ls)의 세기를 결정 한 후에, 부가 정보에 기초하여 좌채널 전방 오디오(L) 및 좌채널 후방 오디오(Ls)의 위상을 계산하여 좌채널 전방 오디오(L)와 좌채널 후방 오디오(Ls)를 복원하는 방법이다.
두 번째 방법은, 첫 번째 방법에 의하여 좌채널 전방 오디오(L) 또는 좌채널 후방 오디오(Ls)가 복원되면, 최초 모노 오디오(LV1)에서 좌채널 후방 오디오(Ls)를 감산하여 좌채널 전방 오디오(L)를 복원하고, 최초 모노 오디오(LV1)에서 좌채널 전방 오디오(L)를 감산하여 좌채널 후방 오디오(Ls)를 복원한다.
세 번째 방법은, 첫 번째 방법을 이용하여 복원된 오디오들과 두 번째 방법을 이용하여 복원된 오디오들을 소정의 비율로 조합하여 오디오들을 복원하는 방법이다.
즉, 첫 번째 방법을 이용하여 복원된 좌채널 전방 오디오(L) 및 좌채널 후방 오디오(Ls)를 각각 Ly 및 Lsy로 명명하고, 두 번째 방법을 이용하여 복원된 좌채널 전방 오디오(L) 및 좌채널 후방 오디오(Ls)를 Lz 및 Lsz로 명명하면, 좌채널 전방 오디오(L) 및 좌채널 후방 오디오(Ls) 각각의 세기는 |L|= a×|Ly| +(1-a)×|Lz|와 |Ls|= a×|Lsy| + (1-a)×|Lsz|로서 결정하고, 부가 정보에 기초하여 좌채널 전방 오디오(L) 및 좌채널 후방 오디오(Ls)의 위상을 계산하여 좌채널 전방 오디오(L)와 좌채널 후방 오디오(Ls)를 복원하는 방법이다. 여기서, a는 0에서 1 사이의 값이다.
한편, 도 10은 L벡터와 Ls 벡터가 90도를 이루는 경우에 대한 실시예이지만, 만일 도 9의 Cr 및 RV1과 같이 Cr 벡터와 RV1 벡터간의 각도가 90도를 이루지 못하 는 경우에는 도 3b에서와 같이 벡터 각도를 정규화하는 과정을 거친 후에 그 정규화된 각도를 이용하여 RV1과 Cr이 복원될 수 있다.
예컨대, 도 3b를 참조하면 Cr은 Ch1 벡터에 대응되고 RV1은 Ch2 벡터에 대응되고 RV2는 BM1 벡터에 대응되는데, 도 3b에 표시된 정규화된 벡터 각도를 이용하여 Cr 및 RV1의 크기를 계산하면 |Cr|=|RV2|sinθm/cosθn가 되고, |RV1|=|RV2|cosθm/cosθn가 된다. 이에 기초하여, Cr 및 RV1에 전술한 첫 번째 방법 내지 세 번째 방법을 적용함으로써 Cr 및 RV1이 복원될 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체0를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으 로 해석되어야 할 것이다.
도 1은 본 발명에 따른 오디오 부호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 2는 파라메트릭 오디오 코딩에서의 서브 밴드들을 도시한다.
도 3a는 본 발명에 따라 제1 채널 입력 오디오 및 제2 채널 입력 오디오의 세기에 대한 정보를 생성하는 방법의 일실시예를 설명하기 위하여 도시한 도면이다.
도 3b는 본 발명에 따른 제1채널 입력 오디오 및 제2채널 입력 오디오의 세기에 대한 정보를 생성하는 방법의 제2 실시예를 설명하기 위하여 도시한 도면이다.
도 4는 본 발명에 따라 부가 정보들을 부호화하는 방법에 대한 일실시예를 설명하기 위하여 도시한 흐름도이다.
도 5는 본 발명에 따른 오디오 부호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.
도 6은 본 발명에 따른 오디오 복호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 7은 본 발명에 따른 오디오 복호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.
도 8은 본 발명의 일실시예에 따른 오디오 부호화 방법을 5.1채널 스테레오 오디오에 적용한 경우에 대한 실시예이다.
도 9는 본 발명의 일실시예에 따른 오디오 복호화 방법을 이용하여 5.1채널 스테레오 오디오를 복호화하는 경우에 대한 실시예이다.
도 10은 본 발명에 따른 업 믹스부의 동작의 일실시예를 설명하기 위하여 도시한 도면이다.

Claims (29)

  1. 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 상기 최초 모노 오디오들에 대하여 복수 회에 걸쳐 상기 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하는 단계;
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 최초 모노 오디오들로부터 상기 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들(transient mono audios) 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및
    상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  2. 제1항에 있어서,
    상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하는 단계;
    상기 부호화된 N개의 입력 오디오들을 복호화하는 단계; 및
    상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 단계를 더 포함하고,
    상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화하는 것을 특징으로 하는 오디오 부호화 방법.
  3. 제1항에 있어서,
    상기 부가 정보들을 부호화하는 단계는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하는 단계; 및
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들각각에서 인접하는 2개의 오디오들 상호간의 위상 차이에 대한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  4. 제3항에 있어서,
    상기 세기를 결정하기 위한 정보를 부호화하는 단계는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성하는 단계;
    상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성하는 단계; 및
    상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기
    제3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  5. 제1항에 있어서,
    상기 최종 모노 오디오를 생성하는 단계는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 전체 개수가 홀수인 경우에는 상기 오디오들 중 하나를 이용하여 2 개의 오디오들을 생성한 후에, 상기 오디들에게 상기 가산 방법을 적용하는 것을 특징으로 하는 오디오 부호화 방법.
  6. 제1항에 있어서,
    상기 최종 모노 오디오를 생성하는 단계, 상기 부가 정보들을 생성하는 단계 및 상기 부가 정보들을 부호화하는 단계는 소정의 주파수 밴드에서 수행되는 것을 특징으로 하는 오디오 부호화 방법.
  7. 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계;
    상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계; 및
    상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에게 복수 회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들을 생성하는 단계를 포함하고,
    상기 최종 복원 오디오들을 생성하는 단계는 상기 최초 복원 오디오들로부터 상기 최종 복원 오디오들을 생성하는 과정에서 과도 복원 오디오들을 생성하는 것을 특징으로 하는 오디오 복호화 방법.
  8. 제7항에 있어서,
    상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 추출하는 단계를 더 포함하고,
    상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성되는 것을 특징으로 하는 오디오 복호화 방법.
  9. 제7항에 있어서,
    상기 복호화된 부가 정보들은
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 인접하는 2개의 복원 오디오들간의 위상 차이에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  10. 제9항에 있어서,
    상기 세기를 결정하기 위한 정보들은
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  11. 제10항에 있어서,
    상기 최초 복원 오디오들을 복원하는 단계는
    상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하는 단계;
    상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제 2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 및 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및
    상기 최초 복원 오디오들의 세기 및 위상에 기초하여, 상기 제1 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제1 최초 복원 오디오를 감산하여 상기 제2 최초 복원 오디오를 복원하고, 상기 제2 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오를 감산하여 상기 제1 최초 복원 오디오를 복원하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  12. 제10항에 있어서,
    상기 최초 복원 오디오들을 복원하는 단계는
    상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 기초하여 복원된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오와 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오 또는 상기 제1 최초 복원 오디오를 감산하여 생성된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 소정 비율로 조합하여 상기 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 복원하는 것을 특징으로 하는 오디오 복호화 방법.
  13. 제10항에 있어서,
    상기 최초 복원 오디오들을 복원하는 단계는
    상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및
    상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  14. 수신되는 N개의 입력 오디오들을 인접하는 2개의 입력 오디오 단위로 상호간에 가산하여 최초 모노 오디오들을 생성하고, 상기 최초 모노 오디오들에 대하여 복수 회에 걸쳐 상기 가산 방법과 동일한 가산 방법을 적용함으로써 하나의 최종 모노 오디오를 생성하는 모노 오디오 생성부;
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 최초 모노 오디오들로부터 상기 최종 모노 오디오를 생성하는 과정에서 생성되는 과도 모노 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 부가 정보 생성부; 및
    상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 부호화부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
  15. 제14항에 있어서,
    상기 모노 오디오 생성부는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각에서 2개의 인접하는 오디오들을 가산하는 복수 개의 다운 믹스부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
  16. 제14항에 있어서,
    상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하고, 상기 부호화된 N개의 입력 오디오들을 복호화한 후, 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 차이 값 정보 생성부를 더 포함하고,
    상기 부호화부는 상기 차이 값에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
  17. 제14항에 있어서,
    상기 부호화부는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하고, 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각에서 인접하는 2개의 오디오들 상호간의 위상 차이에 대한 정보를 부호화하는 것을 특징으로 하는 오디오 부호화 장치
  18. 제14항에 있어서,
    상기 부호화부는
    상기 세기를 결정하기 위한 정보를 부호화할 때, 상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성하고, 상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성하고, 상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기 제3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
  19. 제14항에 있어서,
    상기 모노 오디오 생성부는
    상기 입력 오디오들, 상기 최초 모노 오디오들 및 상기 과도 모노 오디오들 각각의 전체 개수가 홀수인 경우에는 상기 오디오들 중 하나를 이용하여 2 개의 오디오들을 생성한 후에, 상기 오디들에게 상기 가산 방법을 적용하는 것을 특징으로 하는 오디오 부호화 장치.
  20. 제14항에 있어서,
    상기 모노 오디오 생성부, 부가 정보 생성부 및 부호화부는 소정의 주파수 밴드에서의 상기 동작을 수행하는 것을 특징으로 하는 오디오 부호화 장치.
  21. 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 추출부;
    상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 복호화부; 및
    상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에게 복수 회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용하여 N개의 최종 복원 오디오들을 생성하는 오디오 복원부를 포함하고,
    상기 최종 복원 오디오들을 생성하는 단계는 상기 최초 복원 오디오들로부터 상기 최종 복원 오디오들을 생성하는 과정에서 과도 복원 오디오들을 생성하는 것을 특징으로 하는 오디오 복호화 장치.
  22. 제21항에 있어서,
    상기 오디오 복원부는
    상기 부가 정보들에 기초하여, 상기 복호화된 모노 오디오, 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  23. 제21항에 있어서,
    상기 추출부는
    상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 더 추출하고,
    상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성되는 것을 특징으로 하는 오디오 복호화 장치.
  24. 제21항에 있어서,
    상기 복호화된 부가 정보들은
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 각각에서 인접하는 2개의 복원 오디오들간의 위상 차이에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  25. 제24항에 있어서,
    상기 세기를 결정하기 위한 정보들은
    상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디 오들 각각에서 인접하는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  26. 제25항에 있어서,
    상기 오디오 복원부는
    상기 2개의 최초 복원 오디오들을 복원할 때, 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하고, 상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 및 상기 제2 최초 복원 오디오의 위상을 계산하고, 상기 최초 복원 오디오들의 세기 및 위상에 기초하여, 상기 제1 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제1 최초 복원 오디오를 감산하여 상기 제2 최초 복원 오디오를 복원하고, 상기 제2 최초 복원 오디오가 복원되면 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오를 감산하여 상기 제1 최초 복원 오디오를 복원하는 것을 특징으로 하는 오디오 복호화 장치.
  27. 제25항에 있어서,
    상기 오디오 복원부는
    상기 2개의 최초 복원 오디오들을 복원할 때, 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 기초하여 복원된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오와, 상기 복호화된 모노 오디오에서 상기 제2 최초 복원 오디오 또는 상기 제1 최초 복원 오디오를 감산하여 생성된 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 소정 비율로 조합하여 상기 제1 최초 복원 오디오 또는 제2 최초 복원 오디오를 복원하는 것을 특징으로 하는 오디오 복호화 장치.
  28. 제24항에 있어서,
    상기 오디오 복원부는
    상기 최초 복원 오디오들을 복원할 때, 상기 복호화된 모노 오디오의 위상 및 상기 2개의 최초 복원 오디오들에서의 제1 최초 복원 오디오와 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제2 최초 복원 오디오의 위상을 계산하고, 상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 것을 특징으로 하는 오디오 복호화 장치.
  29. 제1항 내지 제13항 중 어느 한 항의 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
KR1020090079769A 2009-08-27 2009-08-27 스테레오 오디오의 부호화, 복호화 방법 및 장치 KR20110022251A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090079769A KR20110022251A (ko) 2009-08-27 2009-08-27 스테레오 오디오의 부호화, 복호화 방법 및 장치
US12/868,077 US8744089B2 (en) 2009-08-27 2010-08-25 Method and apparatus for encoding and decoding stereo audio

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090079769A KR20110022251A (ko) 2009-08-27 2009-08-27 스테레오 오디오의 부호화, 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20110022251A true KR20110022251A (ko) 2011-03-07

Family

ID=43624937

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090079769A KR20110022251A (ko) 2009-08-27 2009-08-27 스테레오 오디오의 부호화, 복호화 방법 및 장치

Country Status (2)

Country Link
US (1) US8744089B2 (ko)
KR (1) KR20110022251A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600639B2 (en) 2016-11-14 2020-03-24 Applied Materials, Inc. SiN spacer profile patterning

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004798A (en) * 1997-05-14 1999-12-21 University Of Southern California Retroviral envelopes having modified hypervariable polyproline regions
US20020177571A1 (en) * 2000-11-29 2002-11-28 Gordon Erlinda M. Targeted vectors for cancer immunotherapy
US20040192585A1 (en) * 2003-03-25 2004-09-30 3M Innovative Properties Company Treatment for basal cell carcinoma
WO2007007263A2 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio encoding and decoding
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
JP2009532712A (ja) * 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR101449434B1 (ko) * 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600639B2 (en) 2016-11-14 2020-03-24 Applied Materials, Inc. SiN spacer profile patterning

Also Published As

Publication number Publication date
US20110051939A1 (en) 2011-03-03
US8744089B2 (en) 2014-06-03

Similar Documents

Publication Publication Date Title
KR101613975B1 (ko) 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
KR101444102B1 (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
RU2407073C2 (ru) Кодирование многоканального аудио
PT1851997E (pt) Esquema codificador/descodificador multicanal transparente ou quase-transparente
JP2011522472A (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
KR102590816B1 (ko) 방향 컴포넌트 보상을 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램
CN110648674B (zh) 多声道音频内容的编码
CN105308680A (zh) 音频编码器和解码器
CN102027535A (zh) 信号处理
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치
KR20110022252A (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR20110022251A (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101692394B1 (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
E801 Decision on dismissal of amendment