KR102370348B1 - 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 - Google Patents

오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 Download PDF

Info

Publication number
KR102370348B1
KR102370348B1 KR1020210022643A KR20210022643A KR102370348B1 KR 102370348 B1 KR102370348 B1 KR 102370348B1 KR 1020210022643 A KR1020210022643 A KR 1020210022643A KR 20210022643 A KR20210022643 A KR 20210022643A KR 102370348 B1 KR102370348 B1 KR 102370348B1
Authority
KR
South Korea
Prior art keywords
audio
channel
audio data
information
data
Prior art date
Application number
KR1020210022643A
Other languages
English (en)
Other versions
KR20210021516A (ko
Inventor
유재현
서정일
강경옥
이태진
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190150660A external-priority patent/KR102220521B1/ko
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020210022643A priority Critical patent/KR102370348B1/ko
Publication of KR20210021516A publication Critical patent/KR20210021516A/ko
Priority to KR1020220025880A priority patent/KR102529400B1/ko
Application granted granted Critical
Publication of KR102370348B1 publication Critical patent/KR102370348B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

오디오 로우(raw) 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성하는 오디오 메타데이터 생성부; 및 상기 생성된 오디오 메타데이터를 오디오 데이터 재생 장치에 송신하는 오디오 메타데이터 송신부를 포함하는 오디오 메타데이터 제공 장치가 개시된다.

Description

오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법{APPARATUS AND METHOD FOR PROVIDING THE AUDIO METADATA, APPARATUS AND METHOD FOR PROVIDING THE AUDIO DATA, APPARATUS AND METHOD FOR PLAYING THE AUDIO DATA}
본 발명은 멀티채널을 가진 오디오 데이터를 생성하여 이를 오디오 데이터 재생 장치에 제공하는 방법에 관한 것으로, 보다 구체적으로는 오디오 신호의 채널 정보를 포함하는 메타데이터를 사용하여 멀티채널의 오디오 데이터를 표현하는 방법에 관한 것이다.
오디오 데이터를 멀티채널로 구현하기 위해서는 오디오 콘텐츠가 몇 개의 신호로 만들어져 있는지, 어떤 채널을 공간상의 어떤 위치에 배치해야 하는지에 관한 정보가 필요하다. 기존의 5.1채널 오디오 데이터는 총 6개의 신호가 0, +30, +110, +250, +330, null 도 위치에서 제작 및 재생되는 것을 기본 조건으로 하고 있다.
UHDTV 기술이 개발되고, HDTV에서 제공하던 5.1채널보다 많은 스피커를 사용하면서 보다 사실감이 높은 오디오 재생 방식에 대한 연구가 크게 관심을 받고 있다. 또한, 실제로 5.1채널 이상의 다양한 재생 방식이 존재하고 있다.
종래의 멀티채널을 가진 오디오 데이터의 표현 방법과 관련하여, 한국등록특허 제10-0522593호는 멀티채널 오디오 시스템에서 복수의 출력이 추가된 경우, 추가된 출력을 기존의 멀티채널 오디오와 조화되도록 생성하여 자연스러운 입체음향을 구현한 멀티채널 오디오 구현 방법을 제안하고 있다.
구체적으로, 멀티채널 오디오 구현 방법은 인코딩된 오디오 스트림을 입력받아 디코딩하는 단계, 디코딩된 오디오 스트림을 이용하여 멀티채널의 입체음향 사운드를 생성하는 단계를 포함한다. 그 다음으로, 멀티채널 오디오 구현 방법은 생성된 멀티채널 사운드 출력에서 좌측 스테레오 채널 신호와 우측 스테레오 채널 신호 및 중앙 채널의 신호를 이용하여 텔레비전 좌측 스피커 출력 및 텔레비전 우측 스피커 출력을 생성하는 단계를 포함하여 채널을 추가한 멀티채널 오디오를 제공한다.
그러나 종래의 멀티채널 오디오 구현 방법은, 5.1채널을 7.1채널로 변환하는 구성만 기재하고 있으며, 다양한 방식의 오디오 채널 시스템 구성이 어렵다는 단점이 존재한다.
또한, 현재 Auro 3D, T.Holman 12.2(10.2)채널 등 여러 방식들은 6개 이상의 스피커를 수평면 이외의 위치에도 배치하여 독자적인 방식으로 오디오 채널을 표현하고 있지만, A/V 리시버 등 별도의 추가적인 시스템이 반드시 필요하다는 단점을 가지고 있다.
따라서, 멀티채널을 가진 오디오 데이터를 다양한 방식으로 표현할 수 있는 기술이 요구된다.
본 발명은 오디오 로우(raw) 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성하여 오디오 재생 장치에 전송할 수 있는 오디오 메타데이터 제공 장치를 제공한다.
본 발명은 오디오 로우 데이터와 오디오 로우 데이터의 채널 정보가 포함된 오디오 메타데이터를 결합하고, 이를 오디오 재생 장치에 전송하여 멀티채널 오디오를 다양한 방식으로 출력할 수 있는 오디오 데이터 제공 장치를 제공한다.
본 발명은 오디오 데이터 제공 장치로부터 수신한 오디오 데이터를 디멀티플렉싱(demultiplexing) 또는 디코딩(decoding)하여 오디오 메타데이터에 따라 오디오 로우 데이터를 재생할 수 있는 오디오 데이터 재생 장치를 제공한다.
본 발명은 재생 환경 정보에 포함된 채널이 오디오 로우 데이터에 포함된 채널보다 하위 채널인 경우, 오디오 로우 데이터에 포함된 오디오 채널의 신호를 조합하는 방식을 통해 채널 호환이 가능한 오디오 데이터 재생 장치를 제공한다.
본 발명의 일실시예에 따른 오디오 메타데이터 제공 장치는 오디오 로우(raw) 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성하는 오디오 메타데이터 생성부; 및 생성된 오디오 메타데이터를 오디오 데이터 재생 장치에 송신하는 오디오 메타데이터 송신부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 데이터 제공 장치는 오디오 로우 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성하는 오디오 메타데이터 생성부; 오디오 로우 데이터와 생성된 오디오 메타데이터를 하나의 오디오 데이터로 결합하는 오디오 데이터 결합부; 및 결합된 오디오 데이터를 오디오 데이터 재생 장치에 송신하는 오디오 데이터 송신부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 데이터 재생 장치는 오디오 데이터 제공 장치로부터 오디오 데이터를 수신하는 오디오 데이터 수신부; 수신한 오디오 데이터에서 오디오 로우 데이터와 오디오 메타데이터를 분석하는 오디오 데이터 분석부; 및 분석한 오디오 메타데이터와 미리 설정된 재생 환경 정보를 기초로 하여 오디오 로우 데이터를 재생하는 오디오 데이터 재생부를 포함할 수 있다.
본 발명의 일실시예에 따르면, 오디오 로우(raw) 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성하여 오디오 재생 장치에 전송할 수 있다.
본 발명의 일실시예에 따르면, 오디오 로우 데이터와 오디오 로우 데이터의 채널 정보가 포함된 오디오 메타데이터를 결합하고, 이를 오디오 재생 장치에 전송하여 멀티채널 오디오를 다양한 방식으로 출력할 수 있다.
본 발명의 일실시예에 따르면, 오디오 데이터 제공 장치로부터 수신한 오디오 데이터를 디멀티플렉싱(demultiplexing) 또는 디코딩(decoding)하여 오디오 메타데이터에 따라 오디오 로우 데이터를 재생할 수 있다.
본 발명의 일실시예에 따르면, 재생 환경 정보에 포함된 채널이 오디오 로우 데이터에 포함된 채널보다 하위 채널인 경우, 오디오 로우 데이터에 포함된 오디오 채널의 신호를 조합하는 방식을 통해 채널 호환이 가능하다.
도 1은 본 발명의 일실시예에 따른 오디오 데이터의 구성을 설명하기 위한 도면이다.
도 2는 본 발명의 일실시예에 따른 오디오 메타데이터 제공 장치가 오디오 데이터 재생 장치에 오디오 메타데이터를 전송하는 동작을 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 따른 오디오 데이터 제공 장치가 오디오 데이터 재생 장치에 오디오 데이터를 전송하는 동작을 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 오디오 메타데이터의 구성을 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 오디오 메타데이터 구성의 한 실시예를 설명하기 위한 도면이다.
도 6은 본 발명의 일실시예에 따른 오디오 채널 위치 정보의 기준을 설명하기 위한 도면이다.
도 7은 본 발명의 일실시예에 따른 오디오 채널 위치 정보에 기초하여 공간상에 스피커를 배치한 도면이다.
도 8은 본 발명의 오디오 메타데이터 구성의 다른 실시예를 설명하기 위한 도면이다.
도 9는 본 발명의 일실시예에 따른 오디오 메타데이터 제공 장치가 오디오 메타데이터를 제공하는 동작을 나타낸 흐름도이다.
도 10은 본 발명의 일실시예에 따른 오디오 데이터 제공 장치가 오디오 데이터를 제공하는 동작을 나타낸 흐름도이다.
도 11은 본 발명의 일실시예에 따른 오디오 데이터 재생 장치가 오디오 데이터를 재생하는 동작을 나타낸 흐름도이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 본 발명의 일실시예에 따른 오디오 메타데이터 제공 방법은 오디오 메타데이터 제공 장치에 의해 수행될 수 있으며, 본 발명의 일실시예에 따른 오디오 데이터 제공 방법은 오디오 데이터 제공 장치에 의해 수행될 수 있다. 또한, 본 발명의 일실시예에 따른 오디오 데이터 재생 방법은 오디오 데이터 재생 장치에 의해 수행될 수 있다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 오디오 데이터의 구성을 설명하기 위한 도면이다.
도 1을 참고하면, 오디오 데이터(110)는 오디오 로우 데이터(120)와 오디오 메타데이터(130)로 구성될 수 있다. 오디오 로우(raw) 데이터는 오디오 신호를 의미하며, 채널의 개수만큼 오디오 신호를 포함할 수 있다. 오디오 로우 데이터(120)는 제작된 오디오 신호를 차례대로 저장할 수 있다. 예를 들어, 5.1채널의 오디오 데이터(110)인 경우, 오디오 로우 데이터(120)에는 L(Left), R(Right), C(Center), LFE(Low Frequency Effect), LS(Left Side), RS(Right Side) 채널과 관련된 각각의 신호(140)가 포함될 수 있다.
오디오 메타데이터(130)는 오디오 신호에 관련된 표현 정보를 의미하며, 오디오 로우 데이터(120)의 채널 정보를 포함할 수 있다. 이에 대한 자세한 설명은 도 4에서 후술한다.
도 2는 본 발명의 일실시예에 따른 오디오 메타데이터 제공 장치가 오디오 데이터 재생 장치에 오디오 메타데이터를 전송하는 동작을 설명하기 위한 도면이다.
도 2를 참고하면, 오디오 메타데이터 제공 장치(210)는 오디오 메타데이터 생성부(220)와 오디오 메타데이터 송신부(230)를 포함할 수 있다.
오디오 메타데이터 생성부(220)는 오디오 로우 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성할 수 있다. 생성된 오디오 메타데이터는 오디오 로우 데이터와는 별도로 관리될 수 있으며, 오디오 메타데이터 제공 장치(210)에 의해 코딩될 수 있다.
오디오 메타데이터 송신부(230)는 오디오 메타데이터를 오디오 데이터 재생 장치(250)에 송신할 수 있다. 오디오 메타데이터 송신부(230)는 다른 실시예에 있어, 오디오 로우 데이터 제공 장치(240)로부터 수신한 오디오 로우 데이터와 오디오 메타데이터를 멀티플렉싱(Multiplexing)하여 오디오 데이터 재생 장치(250)에 전송할 수 있다. 여기서 멀티플렉싱이란 여러 신호를 합쳐 한 개의 신호로 처리하는 방법을 의미한다.
오디오 로우 데이터 제공 장치(240)는 오디오 데이터 재생 장치(250)에 오디오 신호가 채널 별로 집합해 있는 오디오 로우 데이터를 전송할 수 있다. 경우에 따라, 오디오 메타데이터 제공 장치(210)는 오디오 로우 데이터 제공 장치(240)와 연동하여 오디오 로우 데이터를 기초로 하여 오디오 메타데이터를 생성할 수 있다.
오디오 데이터 재생 장치(250)는 수신한 오디오 로우 데이터와 오디오 메타데이터를 분석하여 오디오 로우 데이터를 재생할 수 있다. 이 때, 오디오 데이터 재생 장치(250)는 오디오 데이터 재생 장치(250)에 저장된 오디오 환경 설정 정보와 오디오 메타데이터에 기초하여 오디오 로우 데이터를 채널 정보에 맞게 재생할 수 있다.
도 3은 본 발명의 일실시예에 따른 오디오 데이터 제공 장치가 오디오 데이터 재생 장치에 오디오 데이터를 전송하는 동작을 설명하기 위한 도면이다.
도 3을 참고하면, 오디오 데이터 제공 장치(310)는 오디오 메타데이터 생성부(320), 오디오 데이터 결합부(330), 및 오디오 데이터 송신부(340)를 포함할 수 있다.
오디오 메타데이터 생성부(320)는 오디오 로우 데이터의 채널 정보가 포함된 오디오 메타데이터를 생성할 수 있다. 즉, 오디오 메타데이터 생성부(320)는 오디오 로우 데이터를 분석하여, 오디오 신호의 채널 정보를 오디오 메타데이터로 나타낼 수 있다.
오디오 데이터 결합부(330)는 오디오 로우 데이터와 오디오 메타데이터를 하나의 오디오 데이터로 결합할 수 있다. 이 때, 오디오 데이터 결합부(330)는 오디오 로우 데이터나 오디오 메타데이터만 코딩하거나 오디오 로우 데이터와 오디오 메타데이터를 함께 코딩할 수 있다.
오디오 데이터 송신부(340)는 결합된 오디오 데이터를 오디오 데이터 재생 장치(350)에 송신할 수 있다. 다시 말해, 오디오 데이터 송신부(340)는 코딩된 오디오 데이터를 멀티플렉싱 처리하여 오디오 데이터 재생 장치(350)에 송신할 수 있다.
오디오 데이터 재생 장치(350)는 오디오 데이터 수신부(360), 오디오 데이터 분석부(370), 및 오디오 데이터 재생부(380)를 포함할 수 있다.
오디오 데이터 수신부(360)는 오디오 데이터 제공 장치(310)로부터 오디오 데이터를 수신할 수 있다.
오디오 데이터 분석부(370)는 수신한 오디오 데이터에서 오디오 로우 데이터와 오디오 메타데이터를 분석할 수 있다. 오디오 데이터 분석부(370)는 오디오 데이터를 디멀티플렉싱(demultiplexing) 하거나 디코딩할 수 있다. 오디오 데이터 분석부(370)는 디멀티플렉싱과 디코딩 처리를 통해, 오디오 데이터에서 오디오 로우 데이터와 오디오 메타데이터를 분리할 수 있으며, 오디오 로우 데이터에서 각각의 채널 별 오디오 신호를 추출할 수 있다.
본 발명의 다른 실시예에 따르면, 오디오 데이터 분석부(370)는 수신한 오디오 데이터를 오디오 로우 데이터와 오디오 메타데이터로 분리하고, 사용자는 분리된 오디오 로우 데이터와 오디오 메타데이터를 이용하여 추가적인 오디오 신호의 편집이나 재구성을 할 수 있다.
오디오 데이터 재생부(380)는 분석한 오디오 메타데이터와 미리 설정된 재생 환경 정보를 기초로 하여 오디오 로우 데이터를 재생할 수 있다. 여기서 미리 설정된 재생 환경이란 가정의 TV 시스템이나 A/V 리시버 등의 스피커 배치 상황과 같이 오디오 재생 장치의 오디오 환경 설정 정보를 의미한다.
오디오 데이터 재생부(380)는 재생 환경 정보에 포함된 채널이 오디오 로우 데이터에 포함된 채널보다 하위 채널인 경우, 오디오 메타데이터에 포함된 오디오 채널의 하위 호환 정보에 따라 오디오 로우 데이터에 포함된 오디오 채널의 신호를 조합하여 하위 채널로 변경할 수 있다.
예를 들어, 오디오 로우 데이터에 포함된 채널의 개수가 6인 경우, 오디오 재생 장치의 재생 환경 정보에 포함된 설정 채널 수가 2이면, 오디오 데이터 재생부(380)는 수신한 오디오 데이터를 2채널의 하위 채널로 다운믹싱(Down Mixing)할 수 있다. 여기서 다운믹싱이란 여러 채널이 합쳐진 오디오 데이터를 낮은 수의 채널을 갖는 오디오 데이터로 변환하는 것을 의미한다. 이를 통해, 오디오 데이터 재생 장치(350)는 오디오 환경 설정 정보에 포함된 채널보다 많은 채널을 가진 오디오 데이터를 수신하더라도 채널 호환을 통해 오디오 데이터를 재생할 수 있다.
오디오 데이터 재생 장치(350)는 오디오 환경 설정 정보에 포함된 채널보다 낮은 채널을 가진 오디오 데이터를 수신한 경우, 오디오 신호가 포함되지 않은 채널은 출력하지 않음으로써, 채널의 수에 상관없이 오디오 데이터를 재생할 수 있다.
도 4는 본 발명의 일실시예에 따른 오디오 메타데이터의 구성을 도시한 도면이다.
도 4를 참고하면, 오디오 메타데이터(410)는 오디오 채널의 개수 정보(420), 오디오 채널의 이름 정보(430), 오디오 채널의 위치 정보(440), 또는 오디오 채널의 하위 호환 정보(450) 중 적어도 어느 하나를 포함할 수 있다.
오디오 채널의 개수 정보(420)는 오디오 로우 데이터에 포함된 오디오 신호의 개수를 나타낸다. 예를 들어, 5.1채널 신호가 오디오 로우 데이터에 포함되어 있다면, 오디오 채널의 개수 정보(420)는 6이라는 값을 갖는다. 또한 7.1채널 신호가 오디오 로우 데이터에 포함되어 있다면, 오디오 채널의 개수 정보(420)는 8이라는 값을 갖는다. 경우에 따라, 오디오 채널의 개수 정보(420)는 객체기반으로 저장된 오디오 신호의 객체 수를 나타낼 수도 있다.
오디오 채널의 이름 정보(430)는 오디오 로우 데이터에 포함된 오디오 신호 각각의 채널 이름을 나타낸다. 예를 들어, 5.1채널 신호의 경우 오디오 채널의 이름 정보(430)는 (L, R, C, LFE, LS, RS) 라는 정보를 포함할 수 있다. 이는 오디오 로우 데이터에 저장되어 있는 오디오 신호가 차례대로 L, R, C, LFE, LS, RS 의 이름에 해당한다는 것을 의미한다. 여기서 오디오 채널의 이름과 오디오 신호 순서의 정의는 강제적인 것이 아니라 제작자가 임의대로 설정할 수 있다. 단, 기존 시스템과의 호환을 위해 5.1채널 및 2.0채널 신호는 각각 (L, R, C, LFE, LS, RS), (L, R)과 같은 형태로 통일시켜 사용하는 것이 바람직하다.
오디오 채널의 위치 정보(440)는 오디오 신호 채널이 공간적으로 어느 위치에 배치되어야 하는지를 나타낸다. 오디오 채널의 위치 정보(440)는 수평 방위각 정보와 수직 방위각 정보로 구성될 수 있다.
수평 방위각은 도 6에서와 같이 사용자(610)가 정면을 바라볼 때, 지면에 수평한 면을 기준으로 정면을 기준점인 0도(620)로 하고, 시계방향을 (+) 방향으로 하여 기준을 설정할 수 있다. 수직 방위각도 도 6에서와 같이 사용자(630)가 정면을 바라볼 때, 지면에 수직인 면을 기준으로 정면을 기준점인 0도(640)로 하고, 위쪽 방향을 (+) 방향으로 하여 기준을 설정할 수 있다.
예를 들어 2.0채널의 경우, 오디오 채널의 이름 정보(430)가 (L, R), 오디오 채널의 위치 정보(440)가 [(330, 0), (30, 0)]과 같이 표현된다고 하면, L채널은 수평 330도, 수직 0도에 배치되고, R채널은 수평 30도, 수직 0도 위치에 배치된다는 것을 나타낸다. 어느 위치에 배치되어도 상관 없는 경우에는 null 기호를 이용하여 표시할 수 있으며, 방위각으로는 (null, null)으로 나타낼 수 있다.
오디오 채널의 하위 호환 정보(450)는 오디오 로우 데이터에 포함된 오디오 채널의 신호를 조합하여 하위 채널로 변경하는 방식 정보를 나타낸다. 예를 들어 하위 호환 정보(450)는, 7.1채널을 가진 오디오 로우 데이터가 어떻게 5.1채널 또는 2.0채널과 호환될 수 있는지를 나타낼 수 있다. 5.1채널보다 많은 채널 수를 가진 오디오 데이터는 5.1채널 또는 2.0채널로의 변경 방식 정보를 포함할 수 있으며, 5.1채널의 오디오 데이터는 2.0채널로의 호환 방식 정보만 포함하면 된다.
도 5는 본 발명의 일실시예에 따른 오디오 메타데이터 구성의 한 실시예를 설명하기 위한 도면이다.
도 5에 따르면, 오디오 메타데이터(510)는 오디오 채널의 개수 정보(520), 오디오 채널의 이름 정보(530), 오디오 채널의 위치 정보(540), 오디오 채널의 하위 호환 정보(550)를 포함하고 있다.
오디오의 채널 개수 정보(520)의 값은 6으로 오디오 로우 데이터의 채널 개수가 6개이고 LFE채널이 1개인, 5.1채널임을 알 수 있다. 또한, 오디오 채널의 이름 정보(530)에 따라 오디오 로우 데이터에 포함된 오디오 신호들의 각 채널 이름들이 차례대로 L, R, C, LFE, LS, RS 임을 알 수 있다.
오디오 채널 위치 정보(540)를 보면 L채널은 (330, 0)이 되어 수평 330도, 수직 0도에 배치되고, R채널은 (30, 0)이 되어 수평 30도, 수직 0도에 배치된다. C채널은 (0, 0)으로 수평 0도, 수직 0도에 배치되고, LS채널은 (250, 0)으로 수평 250도, 수직 0도에 배치된다. 또한, RS채널은 (110, 0)이 되어 수평 110도, 수직 0도에 배치되고, LFE채널은 (null, null)이 되어 어느 위치에 배치되어도 상관없음을 나타낸다. 5.1채널 및 2.0채널 신호의 오디오 채널 위치 정보는 기존 시스템과의 호환을 위해 각각 [(330, 0), (30, 0), (0, 0), (null, null), (250, 0), (110, 0)], [(330, 0), (30, 0)]의 값을 갖는 것이 바람직하다.
이를 실제 공간상에 구현한 것이 도 7에 표현되어 있다. 도 7은 도 5에서의 오디오 채널 위치 정보(540)에 기초하여 스피커를 배치한 도면이다.
도 7을 참고하면, 사용자(710)를 중심으로, 각 채널이 배치되어야 할 위치에 스피커가 위치하고 있다. 이는 오디오 메타데이터에 포함된 정보에 기초하여 멀티채널 오디오 데이터를 표현한 것으로, 이를 이용하여 5.1채널보다 더 많은 채널을 가진 멀티채널 오디오 데이터를 다양한 방식으로 구현이 가능하다.
도 5에서, 오디오 채널의 하위 호환 정보(550)를 보면 5.1채널에서 2.0채널로의 다운믹싱을 위한 상수(560)와 계산식(570)을 알 수 있다. 상수인 (a, k)(560)는 오디오 데이터 제작자가 만든 임의의 상수이며, 계산식(570)은 하위 채널 순서에 따라 저장될 수 있다. 계산식(570)에서 D(1)은 (D)의 첫 번째 데이터인 a를 의미하며, D(2)는 (D)의 두 번째 데이터인 k를 의미한다. N(1)은 (N)의 첫 번째 데이터로서 L채널 신호를 의미하고, N(2)는 (N)의 두 번째 데이터로서 R채널 신호를 의미한다. 계속하여, N(3)은 C채널 신호를, N(4)는 LFE채널 신호를, N(5)는 LS채널 신호를, N(6)은 RS채널 신호를 의미한다. 즉, 오디오 채널의 하위 호환 정보(550)는 아래 <표 1>과 같은 다운믹싱 정보를 저장할 수 있다. 상술한 실시예는 5.1채널에서 2.0채널로의 다운믹싱의 한 예를 설명한 것에 불과하고, 여러 변형 및 임의적인 설정이 가능하다.
채널 레이아웃 채널 매트릭싱(channel matrixing)
(a와 k는 임의의 상수)
5.1 -> 2.0
Figure 112021020488289-pat00001
Figure 112021020488289-pat00002
도 8은 본 발명의 오디오 메타데이터 구성의 다른 실시예를 설명하기 위한 도면이다.
도 8에 따르면, 오디오 메타데이터(810)는 오디오 채널의 개수 정보(820), 오디오 채널의 이름 정보(830), 오디오 채널의 위치 정보(840), 및 오디오 채널의 하위 호환 정보(850)로서 3가지 채널로의 호환 정보를 포함하고 있다.
오디오의 채널 개수 정보(820)의 값은 12로 오디오 로우 데이터의 채널 개수가 12개이고 LFE 채널이 두 개인, 10.2채널임을 알 수 있다. 또한, 오디오 채널의 이름 정보(830)에 따라 오디오 로우 데이터에 포함된 오디오 신호들의 각 채널 이름들이 차례대로 L, R, C, LH, RH, LS, RS, LB, RB, TC, LFE1, LFE2 임을 알 수 있다.
오디오 채널 위치 정보(840)를 보면 L채널은 (330, 0)이 되어 수평 330도, 수직 0도에 배치되고, R채널은 (30, 0)으로 수평 30도, 수직 0도에 배치되며, C채널은 (0, 0)으로 수평 0도, 수직 0도에 배치된다. 계속하여, LH채널은 (330, 30)이 되어 수평 330도, 수직 30도에 배치되고, RH채널은 (30, 30)으로 수평 30도, 수직 30도에 배치되며, LS채널은 (270, 0)으로 수평 270도, 수직 0도에 배치된다. 또한, RS채널은 (90, 0)이 되어 수평 90도, 수직 0도에 배치되고, LB채널은 (210, 0)으로 수평 210도, 수직 0도에 배치되며, RB채널은 (150, 0)으로 수평 150도, 수직 0도에 배치된다. TC채널은 (0, 90)으로 수평 0도, 수직 90도에 배치되고, LFE1채널과 LEF2채널은 (null, null)이 되어 어느 위치에 배치되어도 상관없음을 나타낸다. 이와 같이 오디오 메타데이터(810)가 수평면뿐만 아니라 수평면보다 상위 레이어에서의 오디오 채널 정보를 포함할 수 있게 되어 오디오 제작자는 입체적인 음향 시스템을 구성할 수 있다.
오디오 채널의 하위 호환 정보(850)를 보면 10.2채널에서 7.1채널, 5.1채널, 2.0채널로의 다운믹싱을 위한 상수(860)와 계산식(870)을 알 수 있다. 상수(860)인 (a1, c1), (a2, c2) (a3, c3)은 오디오 데이터 제작자가 만든 임의의 상수이며, 다운믹싱 수식 정보(870)는 하위 채널 순서에 따라 저장될 수 있다. 각각의 다운믹싱 수식 정보는 10.2채널에서 각 채널로의 변경을 위한 신호 조합 및 변환 정보가 포함할 수 있다. 이로 인해, 오디오 재생 장치가 10.2채널 오디오 데이터를 수신하더라도, 오디오 재생 장치의 채널 구성에 맞게 호환하여 오디오 데이터를 재생할 수 있다. 다운믹싱 수식 정보가 저장된 순서는 제작자가 임의로 설정할 수 있으며, 위 실시예에 한정되는 것은 아니다.
도 9는 본 발명의 일실시예에 따른 오디오 메타데이터 제공 장치가 오디오 메타데이터를 제공하는 동작을 나타낸 흐름도이다.
단계(910)에서, 오디오 메타데이터 제공 장치는 오디오 로우 데이터에 관련된 정보가 포함된 오디오 메타데이터를 생성할 수 있다. 오디오 메타데이터 제공 장치가 생성한 오디오 메타데이터는 오디오 로우 데이터와는 별도로 관리될 수 있으며, 오디오 메타데이터 제공 장치에 의해 코딩될 수 있다.
단계(920)에서, 오디오 메타데이터 제공 장치는 생성된 오디오 메타데이터를 오디오 데이터 재생 장치에 송신할 수 있다. 오디오 메타데이터 제공 장치는 다른 실시예에 있어, 오디오 로우 데이터 제공 장치로부터 수신한 오디오 로우 데이터와 오디오 메타데이터를 멀티플렉싱하여 오디오 데이터 재생 장치에 전송할 수 있다.
도 10은 본 발명의 일실시예에 따른 오디오 데이터 제공 장치가 오디오 데이터를 제공하는 동작을 나타낸 흐름도이다.
단계(1010)에서, 오디오 데이터 제공 장치는 오디오 로우 데이터에 관련된 정보가 포함된 오디오 메타데이터를 생성할 수 있다. 즉, 오디오 데이터 제공 장치는 오디오 로우 데이터를 기반으로 하여, 오디오 신호에 관련된 정보를 오디오 메타데이터로 나타낼 수 있다.
단계(1020)에서, 오디오 데이터 제공 장치는 오디오 로우 데이터와 생성된 오디오 메타데이터를 하나의 오디오 데이터로 결합할 수 있다. 이때, 오디오 데이터 제공 장치는 오디오 로우 데이터와 오디오 메타데이터를 별도로 코딩하거나 오디오 로우 데이터와 오디오 메타데이터를 함께 코딩할 수 있다.
단계(1030)에서, 오디오 데이터 제공 장치는 결합된 오디오 데이터를 오디오 데이터 재생 장치에 송신할 수 있다. 오디오 데이터 제공 장치는 코딩된 오디오 데이터를 멀티플렉싱 처리하여 오디오 데이터 재생 장치에 송신할 수 있다.
도 11은 본 발명의 일실시예에 따른 오디오 데이터 재생 장치가 오디오 데이터를 재생하는 동작을 나타낸 흐름도이다.
단계(1110)에서, 오디오 데이터 재생 장치는 오디오 데이터 제공 장치로부터 오디오 데이터를 수신할 수 있다.
단계(1120)에서, 오디오 데이터 재생 장치는 수신한 오디오 데이터에서 오디오 로우 데이터와 오디오 메타데이터를 분석할 수 있다. 오디오 데이터 재생 장치는 오디오 데이터를 디멀티플렉싱(demultiplexing) 하거나 디코딩할 수 있다. 오디오 재생 장치는 디멀티플렉싱과 디코딩 처리를 통해, 오디오 데이터에서 오디오 로우 데이터와 오디오 메타데이터를 분리할 수 있으며, 오디오 로우 데이터에서 각각의 채널별 오디오 신호를 추출할 수 있다.
본 발명의 다른 실시예에 따르면, 오디오 데이터 재생 장치는 수신한 오디오 데이터를 오디오 로우 데이터와 오디오 메타데이터로 분리하고, 사용자는 분리된 오디오 로우 데이터와 오디오 메타데이터를 이용하여 추가적인 오디오 신호의 편집이나 재구성을 할 수 있다
단계(1130)에서, 오디오 데이터 재생 장치는 재생 환경 정보에 포함된 채널이 오디오 로우 데이터에 포함된 채널보다 하위 채널인 경우, 오디오 메타데이터에 포함된 오디오 채널의 하위 호환 정보에 따라 오디오 로우 데이터에 포함된 오디오 채널의 신호를 조합하여 하위 채널로 변경할 수 있다.
단계(1140)에서, 오디오 데이터 재생 장치는 재생 환경 정보에 포함된 채널이 오디오 로우 데이터에 포함된 채널과 동일하거나 보다 상위 채널인 경우, 분석한 오디오 메타데이터와 미리 설정된 재생 환경 정보를 기초로 하여 오디오 로우 데이터를 재생할 수 있다. 또한, 오디오 데이터 재생 장치는 단계(1130)에서 하위 채널로 변경한 오디오 로우 데이터를 재생할 수 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 나중에 컴퓨터 시스템에 의해 판독될 수 있는 데이터를 저장할 수 있는 임의의 데이터 저장 장치이다. 컴퓨터 판독 가능 매체의 예는 판독 전용 메모리, 랜덤 엑세스 메모리, CD-ROM, DVD, 자기 테이프, 광학 데이터 저장 장치, 및 반송파를 포함한다. 컴퓨터 판독 가능 매체는 또한, 컴퓨터 판독 가능 코드가 분산된 방식으로 저장 및 실행되도록, 네트워크-연결 컴퓨터 시스템들에 걸쳐 분산되어 일을 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 오디오 데이터
120: 오디오 로우 데이터
130: 오디오 메타 데이터
140: 오디오 신호

Claims (10)

  1. 오디오 데이터의 채널과 관련된 정보를 생성하는 단계;
    상기 오디오 데이터와 상기 채널과 관련된 정보를 제공하는 단계
    를 포함하고,
    상기 채널과 관련된 정보는,
    상기 채널의 이름 정보, 및 채널의 위치 정보를 포함하고,
    상기 오디오 데이터는,
    상기 오디오 데이터가 재생될 때의 재생 환경에 따라 식별된 채널에 기초하여 재생되는 오디오 데이터 제공 방법.
  2. 제1항에 있어서,
    상기 채널과 관련된 정보는,
    상기 채널의 하위 호환 정보를 더 포함하는 오디오 데이터 제공 방법.
  3. 오디오 데이터를 수신하는 단계;
    상기 오디오 데이터의 채널과 관련된 정보를 이용하여 상기 오디오 데이터를 재생하는 단계
    를 포함하고,
    상기 채널과 관련된 정보는,
    상기 채널의 이름 정보, 및 채널의 위치 정보를 포함하고,
    상기 오디오 데이터는,
    상기 오디오 데이터가 재생될 때의 재생 환경에 따라 식별된 채널에 기초하여 재생되는 오디오 데이터 재생 방법.
  4. 제3항에 있어서,
    상기 채널과 관련된 정보는,
    상기 채널의 하위 호환 정보를 더 포함하는 오디오 데이터 재생 방법.
  5. 제3항에 있어서,
    상기 채널과 관련된 정보는, 오디오 채널의 개수 정보를 더 포함하고,
    상기 채널의 개수 정보는,
    오디오 데이터와 관련된 채널의 개수인 오디오 데이터 재생 방법.
  6. 제3항에 있어서,
    상기 채널의 위치 정보는,
    상기 채널이 공간적으로 어느 위치에 배치되어야 하는지를 나타낸 정보인 오디오 데이터 재생 방법.
  7. 제3항에 있어서,
    상기 채널의 위치 정보는,
    수평 방위각 정보 및 수직 방위각 정보를 포함하는 오디오 데이터 재생 방법.
  8. 제3항에 있어서,
    상기 채널의 이름 정보는,
    오디오 데이터에 대한 채널들 각각의 이름인 오디오 데이터 재생 방법.
  9. 제4항에 있어서,
    상기 채널의 하위 호환 정보는,
    상기 오디오 데이터에 대한 채널의 신호를 이용하여 하위 채널로 변경하는 방식 정보인 오디오 데이터 재생 방법.
  10. 오디오 데이터의 채널과 관련된 정보를 식별하는 단계;
    상기 채널과 관련된 정보를 이용하여 상기 오디오 데이터를 재생하는 단계
    를 포함하고,
    상기 채널과 관련된 정보는,
    상기 오디오 데이터와 관련된 채널의 개수 정보 및 채널의 위치 정보를 포함하고,
    상기 오디오 데이터는,
    상기 오디오 데이터가 재생될 때의 재생 환경에 따라 식별된 채널에 기초하여 재생되는 오디오 데이터 재생 방법.
KR1020210022643A 2019-11-21 2021-02-19 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 KR102370348B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210022643A KR102370348B1 (ko) 2019-11-21 2021-02-19 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR1020220025880A KR102529400B1 (ko) 2021-02-19 2022-02-28 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190150660A KR102220521B1 (ko) 2019-11-21 2019-11-21 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR1020210022643A KR102370348B1 (ko) 2019-11-21 2021-02-19 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190150660A Division KR102220521B1 (ko) 2019-11-21 2019-11-21 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220025880A Division KR102529400B1 (ko) 2021-02-19 2022-02-28 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210021516A KR20210021516A (ko) 2021-02-26
KR102370348B1 true KR102370348B1 (ko) 2022-03-04

Family

ID=80813724

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210022643A KR102370348B1 (ko) 2019-11-21 2021-02-19 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102370348B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4324244B2 (ja) * 2007-04-17 2009-09-02 パナソニック株式会社 通信システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100733965B1 (ko) * 2005-11-01 2007-06-29 한국전자통신연구원 객체기반 오디오 전송/수신 시스템 및 그 방법
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4324244B2 (ja) * 2007-04-17 2009-09-02 パナソニック株式会社 通信システム

Also Published As

Publication number Publication date
KR20210021516A (ko) 2021-02-26

Similar Documents

Publication Publication Date Title
US6684060B1 (en) Digital wireless premises audio system and method of operation thereof
JP5174527B2 (ja) 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
EP3839946A1 (en) Signaling audio rendering information in a bitstream
KR102149411B1 (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102322104B1 (ko) 사운드 바를 위한 오디오 신호 처리 장치 및 방법
CN104054126A (zh) 空间音频渲染和编码
KR20140028094A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101915258B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102172279B1 (ko) 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
KR101682323B1 (ko) 음향 신호 기술 방법, 음향 신호 생성 장치 및 음향 신호 재생 장치
US10999678B2 (en) Audio signal processing device and audio signal processing system
KR102370672B1 (ko) 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치
KR102370348B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102529400B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102220521B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102049603B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
JP6204683B2 (ja) 音響信号再生装置、音響信号作成装置
JP6228388B2 (ja) 音響信号再生装置
KR20110049083A (ko) 디지털 오디오 신호를 재생하기 위한 휴대용 멀티미디어 장치, 오디오 재생 장치 및 오디오 시스템
JP2008147840A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
JP2008219563A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
JP6204684B2 (ja) 音響信号再生装置
JP2020120377A (ja) オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法
KR20170120407A (ko) 오디오 객체 신호 재생 시스템 및 그 방법
KR20110034426A (ko) 광디스크 장치 및 그 제어 방법

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant