KR102049602B1 - 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법 - Google Patents

멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법 Download PDF

Info

Publication number
KR102049602B1
KR102049602B1 KR1020120131373A KR20120131373A KR102049602B1 KR 102049602 B1 KR102049602 B1 KR 102049602B1 KR 1020120131373 A KR1020120131373 A KR 1020120131373A KR 20120131373 A KR20120131373 A KR 20120131373A KR 102049602 B1 KR102049602 B1 KR 102049602B1
Authority
KR
South Korea
Prior art keywords
multimedia data
information
audio signal
speaker
channel
Prior art date
Application number
KR1020120131373A
Other languages
English (en)
Other versions
KR20140064253A (ko
Inventor
이용주
서정일
최근우
박태진
강경옥
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120131373A priority Critical patent/KR102049602B1/ko
Priority to US14/049,333 priority patent/US9357325B2/en
Publication of KR20140064253A publication Critical patent/KR20140064253A/ko
Application granted granted Critical
Publication of KR102049602B1 publication Critical patent/KR102049602B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Abstract

멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법이 개시된다. 멀티미디어 데이터 생성 장치는 멀티채널 오디오 신호의 각 채널별 공간 정보를 식별하는 공간 정보 식별부; 및 상기 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 멀티미디어 데이터 생성부를 포함할 수 있다. 멀티미디어 데이터 재생 장치는 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 각 채널별 공간 정보를 분석하는 공간 정보 분석부; 및 상기 공간 정보에 기초하여 멀티미디어 데이터를 재생하는 멀티미디어 데이터 재생부를 포함할 수 있다.

Description

멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법{APPARATUS AND METHOD FOR GENERATING MULTIMEDIA DATA, METHOD AND APPARATUS FOR PLAYING MULTIMEDIA DATA}
아래의 설명은 멀티채널 오디오 신호의 채널별 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 멀티미디어 데이터 생성 장치 및 방법과 그 멀티미디어 데이터를 재생하는 멀티미디어 데이터 재생 장치 및 방법에 관한 것이다.
오디오 신호를 멀티채널로 구현하기 위해서는 오디오 콘텐츠가 몇 개의 신호로 만들어져 있는지, 어떤 채널을 공간 상의 어떤 위치에 배치해야 하는지에 관한 정보가 필요하다. 현재 5.1채널 오디오 신호는 총 6개의 신호가 0, +30, +110, +250, +330, null 도 위치에서 제작 및 재생되는 것을 기본 조건으로 하고 있다.
UHDTV 기술이 개발되고, HDTV에서 제공하던 5.1채널보다 많은 스피커를 사용하면서 보다 사실감이 높은 오디오 재생 방식에 대한 연구가 크게 관심을 받고 있다. 그리고, 최근 멀티미디어 콘텐츠의 품질에 대한 요구가 증가하면서, 5.1 채널보다 7.1 채널, 10.2 채널, 13.2 채널 등의 멀티채널 오디오 콘텐츠를 포함하는 멀티미디어 콘텐츠의 사용이 점차 증가하고 있다.
또한, 멀티채널 오디오를 재생하기 위한 스피커 배치에 관한 논의도 활발해지고 있다. 동일한 개수의 스피커를 사용하더라도 공간상에서 스피커의 배치는 다양할 수 있다. 멀티채널 오디오 콘텐츠를 재생하는 경우, 스피커의 배치 구성에 따라 사용자에게 들리는 오디오가 달라질 수 있다. 따라서, 멀티채널 오디오 콘텐츠를 재생하는 경우에는 오디오 콘텐츠를 재생하기 위한 스피커의 배치 가 중요할 수 있다.
현재 이용되는 멀티채널 오디오 포맷은 멀티채널 오디오 콘텐츠와 스피커 배치와 관련된 정보를 포함하고 있지 아니하여 멀티채널 오디오 콘텐츠를 재생하는데에 어려움이 있다. 따라서, 멀티채널 오디오 콘텐츠를 효과적으로 표현하고, 재생하기 위한 방안이 요구된다.
일실시예에 따른 멀티미디어 데이터 생성 장치는, 멀티채널 오디오 신호의 각 채널별 공간 정보를 식별하는 공간 정보 식별부; 및 상기 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 멀티미디어 데이터 생성부를 포함할 수 있다.
일실시예에 따른 멀티미디어 데이터 재생 장치는, 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 각 채널별 공간 정보를 분석하는 공간 정보 분석부; 및 상기 공간 정보에 기초하여 멀티미디어 데이터를 재생하는 멀티미디어 데이터 재생부를 포함할 수 있다.
일실시예에 따른 멀티미디어 데이터 생성 방법은, 멀티채널 오디오 신호의 각 채널별 공간 정보를 식별하는 단계; 및 상기 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 단계를 포함할 수 있다.
일실시예에 따른 멀티미디어 데이터 재생 방법은, 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 각 채널별 공간 정보를 분석하는 단계; 및 상기 공간 정보에 기초하여 멀티미디어 데이터를 재생하는 단계를 포함할 수 있다.
도 1은 일실시예에 따른 멀티미디어 데이터를 생성하고, 재생하는 동작을 설명하기 위한 도면이다.
도 2는 일실시예에 따른 멀티미디어 데이터 생성 장치의 세부 구성을 도시한 도면이다.
도 3은 일실시예에 따른 멀티미디어 데이터 재생 장치의 세부 구성을 도시한 도면이다.
도 4는 일실시예에 따른 멀티미디어 데이터의 구조의 일례를 도시한 도면이다.
도 5는 일실시예에 따른 멀티미디어 데이터 생성 방법의 동작을 도시한 흐름도이다.
도 6은 일실시예에 따른 멀티미디어 데이터 재생 방법의 동작을 도시한 흐름도이다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 아래의 특정한 구조적 내지 기능적 설명들은 단지 발명의 실시예들을 설명하기 위한 목적으로 예시된 것으로, 발명의 범위가 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 안된다. 일실시예에 따른 멀티미디어 데이터 생성 방법은 멀티미디어 데이터 생성 장치에 의해 수행될 수 있으며, 멀티미디어 데이터 재생 방법은 멀티미디어 재생 장치에 의해 수행될 수 있다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 일실시예에 따른 멀티미디어 데이터를 생성하고, 재생하는 동작을 설명하기 위한 도면이다.
멀티미디어 데이터 생성 장치(110)는 멀티채널 오디오(multi-channel audio) 신호를 포함하는 멀티미디어 데이터를 생성할 수 있다. 또는, 멀티미디어 데이터 생성 장치(110)는 멀티채널 오디오 신호의 재생 정보를 포함하는 멀티미디어 데이터를 생성할 수 있다.
예를 들어, 멀티미디어 데이터 생성 장치(110)는 멀티채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 공간 정보를 포함하는 멀티미디어 데이터를 생성할 수 있다. 공간 정보는 멀티채널 오디오 신호의 재생에 적합한 스피커 배치 정보를 포함할 수 있다. 공간 정보는 멀티미디어 데이터가 생성되거나 편집되는 과정 또는 부호화되는 과정에서 멀티미디어 데이터에 포함될 수 있다. 멀티미디어 데이터 생성 장치(110)는 공간 정보를 멀티미디어 데이터의 헤더(header) 정보에 저장할 수 있다.
예를 들어, 10.2 채널의 멀티채널 오디오 신호의 경우, 멀티미디어 데이터 생성 장치(110)는 멀티미디어 데이터의 헤더 정보에 12개의 스피커들의 위치 정보를 포함하는 멀티미디어 데이터를 생성할 수 있다.
멀티미디어 데이터 생성 장치(110)는 멀티미디어 데이터를 비트스트림의 형태로 생성할 수 있다. 비트스트림은 멀티미디어 데이터와 멀티미디어 데이터와 관련된 헤더 정보를 포함할 수 있다. 헤더 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 재생될 위치 정보와 멀티채널 오디오 신호의 각 채널별 오디오 신호에 매칭되는 스피커에 관한 정보인 스피커 매칭(matching) 정보를 포함할 수 있다.
멀티미디어 데이터 재생 장치(120)는 멀티미디어 데이터 생성 장치(110)에 의해 생성된 멀티미디어 데이터를 재생할 수 있다. 멀티미디어 데이터 재생 장치(120)는 멀티미디어 데이터에 포함된 공간 정보를 분석하고, 분석된 공간 정보에 기초하여 멀티채널 오디오 신호를 재생할 수 있다.
예를 들어, 멀티미디어 데이터 재생 장치(120)는 공간 정보에 포함된 스피커 배치 정보에 기초하여 멀티미디어 데이터를 재생할 수 있다. 멀티미디어 데이터 재생 장치(120)는 공간 정보에 기초하여 어느 스피커가 어느 채널의 오디오 신호를 출력해야 하는지를 결정할 수 있다. 멀티미디어 데이터 재생 장치(120)는 각각의 스피커에 대응되는 채널별 오디오 신호를 해당 스피커를 이용하여 출력할 수 있다.
멀티미디어 데이터 재생 장치(120)는 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 채널별 공간 정보를 이용함으로써, 멀티채널 오디오 신호를 효과적으로 재생할 수 있다.
도 2는 일실시예에 따른 멀티미디어 데이터 생성 장치의 세부 구성을 도시한 도면이다.
도 2를 참조하면, 멀티미디어 데이터 생성 장치(210)는 공간 정보 식별부(220) 및 멀티미디어 데이터 생성부(230)를 포함할 수 있다.
공간 정보 식별부(220)는 멀티채널 오디오 신호의 각 채널별 공간 정보를 식별할 수 있다. 예를 들어, 공간 정보 식별부(220)는 멀티채널 오디오 신호에서 채널별 스피커의 위치 정보 또는 채널과 스피커의 매칭 정보를 식별할 수 있다.
공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호의 재생과 관련된 위치 정보를 포함할 수 있다. 예를 들어, 위치 정보는 멀티채널 오디오 신호가 재생되어야 하는 스피커들의 위치를 나타낼 수 있다. 구체적으로, 위치 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 위치의 스피커에서 재생되어야 하는지를 나타낼 수 있다.
위치 정보는 3차원 좌표의 형태로 구성될 수 있다. 구체적으로, 위치 정보는 3차원 공간상의 x축, y축, z축을 기준으로 하는 3차원 좌표의 형태를 가질 수 있다. 예를 들어, 멀티미디어 데이터 재생 장치가 위치하는 지점, 사용자의 위치 및 수평면에 기초하여 기준 축을 설정하고, 기준 축에 기초하여 나머지 두 축을 설정할 수 있다. 위치 정보는 설정된 3개의 축에 기초하여 (3m, 4m, 5m) 등의 형태로 저장될 수 있다. 멀티미디어 데이터 생성부(230)는 각각의 오디오 채널에 대응되는 위치 정보를 멀티미디어 데이터의 헤더 정보에 저장할 수 있다.
또한, 위치 정보는 수평 방위각 정보, 수직 방위각 정보 및 거리 정보 중 적어도 어느 하나로 구성될 수 있다. 예를 들어, 위치 정보는 (330도, 0도, 4m) 등의 형태로 저장될 수 있다. 이는 기준 점(예를 들어, 멀티미디어 데이터 재생 장치의 위치)으로부터 4m의 거리만큼 떨어지고, 수평 방위각이 330도, 수직 방위각이 0도인 위치에서 해당 위치 정보에 대응하는 채널의 오디오 신호가 재생되어야 함을 나타낸다.
만약, 기준점을 중심으로 스피커들이 동일한 거리로 배치되어 있는 경우, 위치 정보는 수평 방위각 정보 및 수직 방위각 정보의 형태를 가질 수도 있다. 예를 들어, 위치 정보는 (330도, 0도) 등의 형태로 저장될 수 있다. 이는 해당 위치 정보에 대응되는 오디오 채널이 수평 방위각 330도, 수직 방위각 0도인 위치에서 재생되어야 한다는 것을 나타낸다. 또는, (330도, 0도)는 해당 오디오 채널에 대응되는 스피커가 수평 방위각 330도, 수직 방위각 0도의 위치에 배치되어야 한다는 것을 나타낼 수도 있다. 멀티미디어 데이터 생성부(230)는 사용자가 정면을 바라볼 때, 지면에 수평한 면을 기준으로 정면을 기준점인 0도로 설정하고, 시계방향을 (+) 방향으로 하여 수평 방위각 및 수직 방위각을 설정할 수 있다.
또한, 공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 스피커에 매칭되는지를 나타내는 스피커 매칭 정보를 포함할 수 있다. 예를 들어, 스피커 매칭 정보는 각 채널별 오디오 신호들이 각각의 스피커들과 일대일로 매칭되도록 설정하는 정보를 포함할 수 있다.
멀티미디어 데이터 생성부(230)는 멀티채널 오디오 신호의 각 채널별 공간 정보를 포함하는 멀티미디어 데이터를 생성할 수 있다. 멀티미디어 데이터 생성부(230)는 멀티미디어 데이터의 헤더 정보에 멀티채널 오디오 신호의 각 채널별 공간 정보를 저장할 수 있다.
멀티미디어 데이터 생성부(230)에서 생성된 멀티미디어 데이터는 부호화되거나 또는 멀티플렉싱(multiplexing) 처리되어 멀티미디어 데이터 재생 장치에 제공될 수 있다.
도 3은 일실시예에 따른 멀티미디어 데이터 재생 장치의 세부 구성을 도시한 도면이다.
도 3을 참조하면, 멀티미디어 데이터 재생 장치(310)는 공간 정보 분석부(320) 및 멀티미디어 데이터 재생부(330)를 포함할 수 있다.
공간 정보 분석부(320)는 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 각 채널별 공간 정보를 분석할 수 있다. 예를 들어, 공간 정보 분석부(320)는 멀티미디어 데이터의 헤더 정보에 존재하는 공간 정보를 분석하여 멀티채널 오디오 신호의 재생 정보를 획득할 수 있다. 공간 정보 분석부(320)는 공간 정보에서 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어떤 스피커 배치 환경에서 재생되어야 하는지를 나타내는 스피커 배치 정보를 추출할 수 있다.
공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호의 재생과 관련된 위치 정보를 포함할 수 있다. 위치 정보는 3차원 좌표의 형태로 구성될 수 있으며, 각각의 오디오 채널에 대응되는 위치 정보가 존재할 수 있다. 예를 들어, 위치 정보는 3차원 공간상의 x축, y축, z축을 기준으로 (1m, 0m, 4m) 등의 형태로 저장될 수 있다.
또는, 위치 정보는 수평 방위각 정보, 수직 방위각 정보 및 거리 정보 중 적어도 어느 하나로 구성될 수 있다. 예를 들어, 위치 정보는 (180도, 20도, 3m) 등의 형태로 저장될 수 있다. 만약, 기준점을 중심으로 스피커들이 동일한 거리로 배치되어 있는 경우, 위치 정보는 수평 방위각 정보 및 수직 방위각 정보의 형태를 가질 수도 있다. 예를 들어, 위치 정보는 (270도, 30도) 등의 형태로 저장될 수 있다. 이는 해당 위치 정보에 대응되는 오디오 채널이 수평 방위각 270도, 수직 방위각 30도인 위치에서 재생되어야 한다는 것을 나타낸다. 또는, (270도, 30도)는 해당 오디오 채널에 대응되는 스피커가 수평 방위각 270도, 수직 방위각 30도인 위치에 배치되어야 한다는 것을 나타낼 수도 있다.
또한, 공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호와 각 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함할 수 있다. 공간 정보 분석부(320)는 공간 정보에 포함된 스피커 매칭 정보를 이용하여 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 스피커에서 재생되어야 하는지를 결정할 수 있다.
멀티미디어 데이터 재생부(330)는 공간 정보 분석부(320)에서 분석한 공간 정보에 기초하여 멀티미디어 데이터를 재생할 수 있다. 멀티미디어 데이터 재생부(330)는 멀티미디어 데이터를 디멀티플렉싱(demultiplexing)하거나 복호화할 수 있다.
멀티미디어 데이터 재생부(330)는 멀티미디어 데이터의 오디오 재생 환경에 기초하여 스피커 매칭 정보를 변경하고, 변경된 스피커 매칭 정보에 기초하여 멀티미디어 데이터를 재생할 수 있다. 예를 들어, 멀티미디어 데이터 재생부(330)는 실제 스피커의 배치 환경과 스피커 매칭 정보에 포함된 스피커의 배치 정보가 일치하지 않는 경우, 실제 스피커들의 위치와 스피커 매칭 정보에 포함된 스피커의 위치를 서로 대응되도록 스피커 매칭 정보를 변경할 수 있다. 예를 들어, 멀티미디어 데이터 재생부(330)는 스피커 매칭 정보에 포함된 각각의 스피커들의 위치에서 가장 가까운 거리에 있는 실제의 스피커를 각 채널의 오디오 신호에 대응되는 스피커로 설정할 수 있다.
멀티미디어 데이터 재생부(330)는 멀티미디어 데이터의 오디오 재생 환경에 기초하여 멀티채널 오디오 신호를 변환하여 재생할 수 있다. 예를 들어, 멀티미디어 데이터 재생부(330)는 재생 가능한 오디오 채널의 개수가 멀티미디어 데이터에 포함된 오디오 채널의 개수 보다 낮을 경우, 멀티미디어 데이터에 포함된 멀티채널의 오디오 신호를 다운믹싱(down mixing)할 수 있다. 예를 들어, 5.1 채널까지의 오디오 콘텐츠를 재생할 수 있는 멀티미디어 데이터 재생 장치(310)가 10.1 채널의 오디오 콘텐츠를 포함하는 멀티미디어 데이터를 수신하는 경우, 멀티미디어 데이터 재생부(330)는 10.1 채널의 오디오 콘텐츠를 다운믹싱하여 5.1 채널의 오디오 콘텐츠로 변환할 수 있다. 멀티미디어 데이터 재생부(330)는 멀티채널의 오디오 신호에서 각 채널의 오디오 신호를 조합하는 방식을 통해 멀티채널의 오디오 신호를 다운믹싱할 수 있다.
도 4는 일실시예에 따른 멀티미디어 데이터의 구조의 일례를 도시한 도면이다.
멀티미디어 데이터는 멀티미디어 콘텐츠(420) 및 멀티미디어 콘텐츠(420)와 관련된 헤더 정보(410)를 포함할 수 있다. 또한, 멀티미디어 콘텐츠(420)는 멀티채널의 오디오 콘텐츠를 포함할 수 있고, 헤더 정보(410)에는 멀티채널의 오디오 콘텐츠와 관련된 정보가 포함될 수 있다.
오디오 콘텐츠에 관한 헤더 정보(410)는 오디오 채널의 개수, 오디오 채널의 이름, 오디오 샘플링률, 샘플당 비트 수, 비트율, 부호화 방법 등과 관련된 정보를 포함할 수 있다. 예를 들어, 멀티미디어 콘텐츠(420)에 포함된 오디오 콘텐츠가 10.2 채널인 경우, 오디오 채널의 개수 '12', 오디오 채널의 이름 'L, R, C, LH, RH, LS, RS, LB, RB, TC, LFE1, LFE2', 비트율 '192kbps' 등의 정보가 헤더 정보(410)에 포함될 수 있다.
멀티미디어 데이터 생성 장치는 헤더 정보(410)에 멀티채널 오디오 신호의 각 채널별 공간 정보를 추가적으로 포함시킬 수 있다. 예를 들어, 멀티미디어 데이터 생성 장치가 생성한 헤더 정보(410)에는 는 오디오 채널별 스피커의 위치를 나타내는 정보(채널별 스피커의 위치 정보(430))와 오디오 채널과 매칭되는 스피커를 나타내는 정보(채널과 스피커의 매칭 정보(440))가 포함될 수 있다.
채널별 스피커의 위치 정보(430)는 멀티채널 오디오 신호의 각 채널별 오디오 신호의 위치 정보를 포함할 수 있다. 채널별 스피커의 위치 정보(430)는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 공간 상의 어느 위치에서 재생되어야 하는지를 나타낼 수 있다. 예를 들어, 채널별 스피커의 위치 정보(430)는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 위치의 스피커에서 재생되어야 하는지를 나타낼 수 있다. 채널별 스피커의 위치 정보(430)는 3차원 좌표, 수평 방위각, 수직 방위각 및 거리 정보 중 적어도 어느 하나의 형태로 구성될 수 있다. 예를 들어, 채널별 스피커의 위치 정보(430)는 수평 방위각 정보, 수직 방위각 정보 및 거리 정보로 구성될 수도 있다. 기준점을 중심으로 스피커들이 동일한 거리로 배치되어 있는 경우, 채널별 스피커의 위치 정보(430)는 수평 방위각 정보 및 수직 방위각 정보의 형태를 가질 수도 있다.
채널과 스피커의 매칭 정보(440)는 멀티채널 오디오 신호의 각 채널별 오디오 신호에 매칭되는 스피커 매칭 정보를 포함할 수 있다. 채널과 스피커의 매칭 정보(440)는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 스피커에 매칭되는지를 나타낼 수 있다. 예를 들어, 채널과 스피커의 매칭 정보(440)는 각 채널별 오디오 신호들이 각각의 스피커들과 일대일로 매칭되도록 설정하는 정보를 포함할 수 있다.
멀티미디어 데이터 재생 장치는 멀티미디어 데이터에 포함된 헤더 정보(410)를 이용함으로써 최적의 스피커 배치 환경에서 멀티미디어 데이터를 재생할 수 있다. 멀티미디어 재생 장치는 채널별 스피커의 위치 정보(430) 또는 채널과 스피커의 매칭 정보(440)를 이용하여 각 채널별 오디오 신호가 공간 상의 어느 위치에서 재생되어야 하는지를 판단할 수 있고, 어느 위치의 스피커에서 각 채널별 오디오 신호가 재생되어야 하는지를 판단할 수 있다.
도 5는 일실시예에 따른 멀티미디어 데이터 생성 방법의 동작을 도시한 흐름도이다.
단계(510)에서, 멀티미디어 데이터 생성 장치는 멀티채널 오디오 신호의 각 채널별 공간 정보를 식별할 수 있다. 예를 들어, 멀티미디어 데이터 생성 장치는 멀티채널 오디오 신호에서 채널별 스피커의 위치 정보 또는 채널과 스피커의 매칭 정보를 식별할 수 있다.
공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호의 재생과 관련된 위치 정보를 포함할 수 있다. 예를 들어, 위치 정보는 멀티채널 오디오 신호가 재생되어야 하는 스피커들의 위치를 나타낼 수 있다. 위치 정보는 3차원 좌표의 형태로 구성될 수 있다. 구체적으로, 위치 정보는 3차원 공간상의 x축, y축, z축을 기준으로 하는 3차원 좌표의 형태를 가질 수 있다. 또한, 위치 정보는 수평 방위각 정보, 수직 방위각 정보 및 거리 정보 중 적어도 어느 하나로 구성될 수 있다.
또한, 공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호와 각 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함할 수 있다. 예를 들어, 스피커 매칭 정보는 각 채널별 오디오 신호들이 각각의 스피커들과 일대일로 매칭되도록 설정하는 정보를 포함할 수 있다.
단계(520)에서, 멀티미디어 데이터 생성 장치는 멀티채널 오디오 신호의 각 채널별 공간 정보를 포함하는 멀티미디어 데이터를 생성할 수 있다. 멀티미디어 데이터 생성 장치는 멀티미디어 데이터의 헤더 정보에 멀티채널 오디오 신호의 각 채널별 공간 정보를 저장할 수 있다.
멀티미디어 데이터 생성 장치는 비트스트림의 형태로 멀티미디어 데이터를 생성할 수 있다. 비트스트림은 멀티미디어 데이터와 멀티미디어 데이터와 관련된 헤더 정보를 포함할 수 있다. 헤더 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 재생될 위치 정보와 멀티채널 오디오 신호의 각 채널별 오디오 신호와 각 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함할 수 있다.
도 6은 일실시예에 따른 멀티미디어 데이터 재생 방법의 동작을 도시한 흐름도이다.
단계(610)에서, 멀티미디어 데이터 재생 장치는 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 각 채널별 공간 정보를 분석할 수 있다. 예를 들어, 멀티미디어 데이터 재생 장치는 멀티미디어 데이터의 헤더 정보에 존재하는 공간 정보를 분석하여 멀티채널 오디오 신호의 재생 정보를 획득할 수 있다. 멀티미디어 데이터 재생 장치는 공간 정보에서 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어떤 스피커 배치 환경에서 재생되어야 하는지를 나타내는 스피커 배치 정보를 추출할 수 있다.
공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 공간 상의 어느 위치에서 재생되어야 하는지를 나타내는 위치 정보를 포함할 수 있다. 또한, 공간 정보는 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 스피커에 매칭되는지를 나타내는 스피커 매칭 정보를 포함할 수 있다. 멀티미디어 데이터 재생 장치는 공간 정보에 포함된 스피커 매칭 정보를 이용하여 멀티채널 오디오 신호의 각 채널별 오디오 신호가 어느 스피커에서 재생되어야 하는지를 판단할 수 있다.
단계(620)에서, 멀티미디어 데이터 재생 장치는 단계(610)에서 분석한 공간 정보에 기초하여 멀티미디어 데이터를 재생할 수 있다. 멀티미디어 데이터 재생 장치는 멀티미디어 데이터를 디멀티플렉싱하거나 복호화할 수 있다.
멀티미디어 데이터 재생 장치는 오디오 재생 환경에 기초하여 스피커 매칭 정보를 변경하고, 변경된 스피커 매칭 정보에 기초하여 멀티미디어 데이터를 재생할 수 있다. 예를 들어, 멀티미디어 데이터 재생 장치는 실제 스피커의 배치 환경과 스피커 매칭 정보에 포함된 스피커의 배치 정보를 비교할 수 있다. 멀티미디어 데이터 재생 장치는 스피커의 배치 환경과 스피커 매칭 정보에 포함된 스피커의 배치 정보가 일치하지 않는 경우, 실제 스피커들의 위치와 스피커 매칭 정보에 포함된 스피커의 위치를 서로 대응되도록 스피커 매칭 정보를 변경할 수 있다. 예를 들어, 멀티미디어 데이터 재생 장치는 스피커 매칭 정보에 포함된 각각의 스피커들에서 가장 가까운 거리에 있는 실제의 스피커가 스피커 매칭 정보에 대응되는 스피커가 되도록 스피커 매칭 정보를 변경할 수 있다.
멀티미디어 데이터 재생 장치는 멀티미디어 데이터의 오디오 재생 환경에 기초하여 멀티채널 오디오 신호를 변환하여 재생할 수 있다. 예를 들어, 멀티미디어 데이터 재생 장치는 재생 가능한 오디오 채널의 개수가 멀티미디어 데이터에 포함된 오디오 채널의 개수 보다 낮을 경우, 멀티미디어 데이터에 포함된 멀티채널의 오디오 신호를 다운믹싱할 수 있다. 멀티미디어 데이터 재생 장치는 멀티채널의 오디오 신호에서 각 채널의 오디오 신호를 조합하는 방식을 통해 멀티채널의 오디오 신호를 다운믹싱할 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
110: 멀티미디어 데이터 생성 장치
120: 멀티미디어 데이터 재생 장치

Claims (20)

  1. 멀티채널 오디오 신호의 공간 정보를 식별하는 공간 정보 식별부; 및
    상기 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 멀티미디어 데이터 생성부
    를 포함하고,
    상기 공간 정보는, 상기 멀티 채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 정보이고,
    상기 멀티 채널 오디오 신호의 재생을 위한 스피커의 위치 정보, 상기 멀티 채널 오디오 신호의 재생에 필요한 스피커 배치 정보 및 상기 멀티 채널 오디오 신호의 각 채널별 오디오 신호와 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함하는 멀티미디어 데이터 생성 장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 멀티미디어 데이터 생성부는,
    멀티미디어 데이터의 헤더 정보에 멀티채널 오디오 신호의 각 채널별 공간 정보를 포함시키는 멀티미디어 데이터 생성 장치.
  5. 제1항에 있어서,
    상기 위치 정보는,
    수평 방위각 정보, 수직 방위각 정보 및 거리 정보 중 적어도 어느 하나로 구성되는 멀티미디어 데이터 생성 장치.
  6. 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 공간 정보를 분석하는 공간 정보 분석부; 및
    상기 공간 정보에 기초하여 멀티미디어 데이터를 재생하는 멀티미디어 데이터 재생부
    를 포함하고.
    상기 공간 정보는, 상기 멀티 채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 정보이고,
    상기 멀티 채널 오디오 신호의 재생을 위한 스피커의 위치 정보, 상기 멀티 채널 오디오 신호의 재생에 필요한 스피커 배치 정보 및 상기 멀티 채널 오디오 신호의 각 채널별 오디오 신호와 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함하는 멀티미디어 데이터 재생 장치.
  7. 삭제
  8. 삭제
  9. 삭제
  10. 제6항에 있어서,
    상기 멀티미디어 데이터 재생부는,
    상기 멀티미디어 데이터 재생 장치의 오디오 재생 환경에 기초하여 상기 멀티채널 오디오 신호를 변환하여 재생하는 멀티미디어 데이터 재생 장치.
  11. 제6항에 있어서,
    상기 위치 정보는,
    수평 방위각 정보, 수직 방위각 정보 및 거리 정보 중 적어도 어느 하나로 구성되는 멀티미디어 데이터 재생 장치.
  12. 멀티미디어 재생 장치가 재생할 비트스트림이 기록된 기록 매체에 있어서,
    상기 비트스트림은, 멀티미디어 데이터 및 상기 멀티미디어 데이터와 관련된 멀티 채널 오디오 신호의 공간 정보를 포함하고,
    상기 공간 정보는, 상기 멀티 채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 정보이고,
    상기 멀티 채널 오디오 신호의 재생을 위한 스피커의 위치 정보, 상기 멀티 채널 오디오 신호의 재생에 필요한 스피커 배치 정보 및 상기 멀티 채널 오디오 신호의 각 채널별 오디오 신호와 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함하는 기록 매체.
  13. 멀티채널 오디오 신호의 공간 정보를 식별하는 단계; 및
    상기 공간 정보를 포함하는 멀티미디어 데이터를 생성하는 단계
    를 포함하고,
    상기 공간 정보는, 상기 멀티 채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 정보이고,
    상기 멀티 채널 오디오 신호의 재생을 위한 스피커의 위치 정보, 상기 멀티 채널 오디오 신호의 재생에 필요한 스피커 배치 정보 및 상기 멀티 채널 오디오 신호의 각 채널별 오디오 신호와 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함하는 멀티미디어 데이터 생성 방법.
  14. 삭제
  15. 삭제
  16. 멀티미디어 데이터에 포함된 멀티채널 오디오 신호의 공간 정보를 분석하는 단계; 및
    상기 공간 정보에 기초하여 멀티미디어 데이터를 재생하는 단계
    를 포함하고,
    상기 공간 정보는, 상기 멀티 채널 오디오 신호가 공간 상에서 어떻게 재생되어야 하는지를 나타내는 정보이고,
    상기 멀티 채널 오디오 신호의 재생을 위한 스피커의 위치 정보, 상기 멀티 채널 오디오 신호의 재생에 필요한 스피커 배치 정보 및 상기 멀티 채널 오디오 신호의 각 채널별 오디오 신호와 스피커가 대응되도록 설정하는 스피커 매칭 정보를 포함하는 멀티미디어 데이터 재생 방법.
  17. 삭제
  18. 삭제
  19. 제16항에 있어서,
    상기 재생하는 단계는,
    상기 멀티미디어 데이터 재생 장치의 오디오 재생 환경에 기초하여 상기 스피커 매칭 정보를 변경하고, 변경된 스피커 매칭 정보에 기초하여 멀티미디어 데이터를 재생하는 멀티미디어 데이터 재생 방법.
  20. 제16항에 있어서,
    상기 재생하는 단계는,
    상기 멀티미디어 데이터 재생 장치의 오디오 재생 환경에 기초하여 상기 멀티채널 오디오 신호를 변환하여 재생하는 멀티미디어 데이터 재생 방법.
KR1020120131373A 2012-11-20 2012-11-20 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법 KR102049602B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120131373A KR102049602B1 (ko) 2012-11-20 2012-11-20 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
US14/049,333 US9357325B2 (en) 2012-11-20 2013-10-09 Apparatus and method for generating multimedia data, and apparatus and method for playing multimedia data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120131373A KR102049602B1 (ko) 2012-11-20 2012-11-20 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190150586A Division KR102217997B1 (ko) 2019-11-21 2019-11-21 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140064253A KR20140064253A (ko) 2014-05-28
KR102049602B1 true KR102049602B1 (ko) 2019-11-27

Family

ID=50727955

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120131373A KR102049602B1 (ko) 2012-11-20 2012-11-20 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법

Country Status (2)

Country Link
US (1) US9357325B2 (ko)
KR (1) KR102049602B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378747B2 (en) * 2012-05-07 2016-06-28 Dolby International Ab Method and apparatus for layout and format independent 3D audio reproduction
US11611605B2 (en) 2016-10-21 2023-03-21 Microsoft Technology Licensing, Llc Dynamically modifying an execution environment for varying data
CN107071552B (zh) * 2017-02-15 2019-06-28 Oppo广东移动通信有限公司 播放设备的设置方法、装置、播放设备及控制终端
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US10524078B2 (en) * 2017-11-29 2019-12-31 Boomcloud 360, Inc. Crosstalk cancellation b-chain

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500688A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理装置及び方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2249987B1 (es) * 2004-07-02 2007-06-01 Fabio A. Rivas Quesada Metodo de grabacion, reproduccion y manipulacion de datos de audios en un soporte de datos.
US8073125B2 (en) * 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
KR20100062784A (ko) * 2008-12-02 2010-06-10 한국전자통신연구원 객체 기반 오디오 컨텐츠 생성/재생 장치
EP2194527A3 (en) * 2008-12-02 2013-09-25 Electronics and Telecommunications Research Institute Apparatus for generating and playing object based audio contents
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500688A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理装置及び方法

Also Published As

Publication number Publication date
US20140140515A1 (en) 2014-05-22
US9357325B2 (en) 2016-05-31
KR20140064253A (ko) 2014-05-28

Similar Documents

Publication Publication Date Title
US10674262B2 (en) Merging audio signals with spatial metadata
KR102049602B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
CN107533843A (zh) 用于捕获、编码、分布和解码沉浸式音频的系统和方法
KR102149411B1 (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR20090104674A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
US11924627B2 (en) Ambience audio representation and associated rendering
KR102370672B1 (ko) 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치
JP2021170798A (ja) 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体
KR20130115779A (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102439339B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
KR102217997B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
KR102631005B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
WO2018150774A1 (ja) 音声信号処理装置及び音声信号処理システム
KR102370348B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102049603B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102220521B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US20240147179A1 (en) Ambience Audio Representation and Associated Rendering
KR20150128616A (ko) 사용자 및 스피커의 위치를 이용한 오디오 신호 변환 장치 및 그 방법
JP2006279555A (ja) 信号再生装置及び信号再生方法
KR20220030983A (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102421292B1 (ko) 오디오 객체 신호 재생 시스템 및 그 방법
KR20170095105A (ko) 하이브리드 오디오 신호의 메타 데이터 생성 장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant