KR20190089830A - 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 - Google Patents

객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 Download PDF

Info

Publication number
KR20190089830A
KR20190089830A KR1020190090301A KR20190090301A KR20190089830A KR 20190089830 A KR20190089830 A KR 20190089830A KR 1020190090301 A KR1020190090301 A KR 1020190090301A KR 20190090301 A KR20190090301 A KR 20190090301A KR 20190089830 A KR20190089830 A KR 20190089830A
Authority
KR
South Korea
Prior art keywords
audio signal
audio
identification information
mixing
information
Prior art date
Application number
KR1020190090301A
Other languages
English (en)
Inventor
이용주
이태진
강경옥
김진웅
안치득
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020190090301A priority Critical patent/KR20190089830A/ko
Publication of KR20190089830A publication Critical patent/KR20190089830A/ko
Priority to KR1020210027569A priority patent/KR102471718B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/95Arrangements characterised by the broadcast information itself characterised by a specific format, e.g. an encoded audio stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

멀티 채널 오디오 부호화 및 복호화를 이용하여 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법이 제공된다. 방송 송신 장치는 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지를 식별하기 위한 오디오 식별 정보를 생성할 수 있다. 그러면, 방송 재생 장치는 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인 경우, 멀티 채널 오디오 신호를 채널 별로 제어하여 출력할 수 있다.

Description

객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법{BROADCASTIONG TRANSMITTING AND REPRODUCING APPARATUS AND METHOD FOR PROVIDING THE OBJECT AUDIO}
본 발명은 멀티 채널 오디오 부호화 및 복호화를 이용하여 객체 기반 오디오를 제공하는 기술에 과한 것이다.
객체 기반 오디오 서비스는 오디오 내에 포함된 여러 음원들을 사용자가 제어하면서 청취할 수 있는 오디오디오 서비스이다. 일반적으로, 음악은 기타, 피아노, 베이스 등의 악기와 보컬의 목소리 등이 믹싱(mixing)된 형태를 갖는다. 특히, 객체기반 오디오 서비스는 일반적인 오디오와 달리 여러가지 악기와 가수의 목소리 등을 믹싱하지 않고 독립적으로 부호화하거나, 저장/전송할 수 있다. 이에 따라, 객체 기반 오디오 서비스를 이용하는 경우, 재생 단말은 각 악기나 보컬의 목소리 만을 개별적으로 제어할 수 있다.
그런데, 객체 기반 오디오 서비스의 경우, 오디오 객체 별로 독립적으로 부호화 및 복호화가 이루어진다. 이에 따라, DTV(Digital Television), DMB(Digital Multimedia Broadcasting), DAB(Digital Audio Broadcasting) 등의 방송 시스템과는 호환되지 않는 어려움이 있다. 다시 말해, DTV, DMB, DAB 등의 방송 송신 및 재생 장치에서는 객체 별로 오디오 신호를 제어하는 데 어려움이 존재한다.
따라서, DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있는 기술이 필요하다.
본 발명은 오디오 식별 정보를 이용하여 DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 방송 송신 장치는, 멀티 채널 오디오 신호를 부호화하는 오디오 부호화부, 및 상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 오디오 식별 정보 생성부를 포함할 수 있다.
또한, 비디오 신호를 부호화하는 비디오 부호화부를 더 포함할 수 있다.
또한, 상기 오디오 식별 정보, 믹싱 정보, 및 부호화된 멀티 채널 오디오 신호를 패킷화 및 다중화하는 패킷화 및 다중화부를 더 포함할 수 있다.
또한, 상기 오디오 식별 정보 생성부는, 상기 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다.
또한, 상기 오디오 식별 정보 생성부는, 상기 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
본 발명의 일실시예에 따른 방송 송신 방법은, 멀티 채널 오디오 신호를 부호화하는 단계, 및 상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 단계를 포함할 수 있다.
또한, 상기 오디오 식별 정보, 믹싱 정보, 및 부호화된 오디오 신호를 패킷화 및 다중화 하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따른 방송 재생 장치는, 비트스트림으로부터 추출된 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 멀티 채널 오디오 신호 판별부, 및 부호화된 멀티 채널 오디오 신호를 복호화하는 오디오 복호화부를 포함할 수 있다.
또한, 하나 이상의 믹싱 정보가 입력되는 경우, 상기 다운 믹스부는, 입력된 믹싱 정보 중 디폴트(default) 로 설정된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
또한, 하나 이상의 믹싱 정보가 입력되는 경우, 상기 다운믹스부는, 입력된 믹싱 정보 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
또한, 상기 다운믹스부는, 사용자 조작을 통해 입력된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
본 발명의 일실시예에 따른 방송 재생 방법은, 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 단계, 및 부호화된 멀티 채널 오디오 신호를 복호화하는 단계를 포함할 수 있다.
본 발명에 따르면, 멀티 채널 오디오 신호가 서라운드 오디오 신호인지, 또는 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 이용하여 DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 방송 송신 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 방송 송신 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 방송 재생 장치의 구성을 도시한 블록도이다.
도 4는 본 발명의 일실시예에 따른 방송 재생 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
이하에서, 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 방송 송신 장치의 구성을 도시한 블록도이다.
도 1에 따르면, 방송 송신 장치(100)는 비디오 부호화부(110), 오디오 부호화부(120), 오디오 식별 정보 생성부(130), 및 패킷화 및 다중화부(140)를 포함할 수 있다.
비디오 부호화부(110)는 MPEG 등의 다양한 압축 알고리즘을 이용하여 비디오 신호를 부호화할 수 있다.
오디오 부호화부(120)는 멀티 채널 오디오 신호를 부호화할 수 있다.
오디오 식별 정보 생성부(130)는 멀티 채널 오디오 신호가 서라운드(surround) 오디오 신호인지, 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성할 수 있다.
이때, 오디오 식별 정보 생성부(130)는 오디오 식별 정보를 디스크립터(descriptor) 형태로 생성할 수 있다. 그러면, 디스크립터 형태의 시그 오디오 식별 정보는 MPEG-2 TS의 PMT에 삽입되어 방송 재생 장치로 전송될 수 있다.
또한, 오디오 식별 정보 생성부(130)는, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다. 이때, 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 오디오 식별 정보 생성부(130)는 믹싱 정보가 삽입된 오디오 식별 정보를 생성할 수 있다. 마찬가지로, 오디오 식별 정보 생성부(130)는 믹싱 정보가 삽입된 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
일례로, 가수 등의 음성(voice), 악기 1, 악기 2에 대한 믹싱 정보를 생성하는 경우, 오디오 식별 정보 생성부(130)는 음성:악기 1:악기 2를 1:1:1로 믹싱(Mixing)하는 믹싱 정보 1, 음성:악기 1:악기 2를 1:0:1로 믹싱하는 믹싱 정보 2, 음성:악기 1:악기 2를 1:1:0으로 믹싱하는 믹싱 정보 3을 생성할 수 있다. 그리고, 오디오 식별 정보 생성부(130)는 믹싱 정보 1, 믹싱 정보 2, 및 믹싱 정보 3를 오디오 식별 정보에 삽입하여 생성할 수 있다. 이때, 믹싱 정보 1 내지 믹싱 정보 3 중 어느 하나가 디폴트(default)로 기설정될 수 있다.
패킷화 및 다중화부(140)는 부호화된 비디오 신호, 부호화된 오디오 신호, 및 오디오 식별 정보를 각각 패킷화할 수 있다. 그리고, 패킷화 및 다중화부(140)는 패킷화된 비디오 신호, 패킷화된 오디오 신호, 및 패킷화된 오디오 식별 정보를 다중화하여 하나의 비트스트림을 생성할 수 있다. 그러면, 방송 송신 장치(100)는 비트스트림을 방송 재생 장치로 전송할 수 있다.
이상에서 설명한 도 1의 방송 송신 장치는 부호화된 멀티 채널 오디오 신호와 오디오 식별 정보를 USB, 외장 하드 디스크, 블루레이(Blu-ray) 디스크, DBD 등의 저장 매체에 저장할 수 있다. 이때, 방송 송신 장치는 오디오 식별 정보를 디스크립터 형태로 저장 매체에 저장할 수도 있다.
또한, 도 1에서 설명한 방송 송신 장치로는 DTV, DMB, 및 DAB 등을 제공하는 휴대용 단말, 가정용 단말, 및 차량용 단말 등이 이용될 수 있다.
도 2는 본 발명의 일실시예에 따른 방송 송신 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
먼저, 210 단계에서, 방송 송신 장치는 MPEG-2, HEVC 등의 영상 압축 알고리즘을 이용하여 비디오 신호를 부호화할 수 있다.
이어, 220 단계에서, 방송 송신 장치는 AC-3(Audio Coding-3), AAC(Advanced Audio Coding), BSAC(Bit-Sliced Arithmetic Coding) 등의 오디오 압축 알고리즘 이용하여 멀티 채널 오디오 신호를 부호화할 수 있다.
그리고, 230 단계에서, 방송 송신 장치는 멀티 채널 오디오 신호가 객체 기반 오디오 신호 인지, 서라운드 오디오 신호(surround)인지를 식별하기 위한 오디오 식별 정보를 생성할 수 있다. 일례로, 방송 송신 장치는, 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
이때, 방송 송신 장치는 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다. 그리고,, 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 방송 송신 장치는는 믹싱 정보가 삽입된 오디오 식별 정보를 생성할 수 있다. 이때, 방송 송신 장치는 믹싱 정보가 삽입된 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
이어, 240 단계에서, 방송 송신 장치는 오디오 식별 정보, 부호화된 비디오 신호 및 부호화된 오디오 신호를 각각 패킷화할 수 있다. 그리고, 방송 송신 장치는 패킷화된 오디오 식별 정보, 패킷화된 비디오 신호, 및 패킷화된 오디오 신호를 다중화하여 비트스트림을 생성할 수 있다.
이상의 도 2에서, 210 내지 230 단계의 순서는 서로 바뀔 수 있다. 다시 말해, 비디오 신호 및 멀티 채널 오디오 신호를 부호화하고, 오디오 식별 정보를 생성하는 순서는 서로 바뀔 수 있다.
한편, 도 2에서, 방송 송신 장치는 부호화된 멀티 채널 오디오 신호와 오디오 식별 정보를 저장 매체에 저장할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 저장 매체에 저장된 오디오 식별 정보는 디스크립터 형태일 수 있다.
도 3은 본 발명의 다른 실시예에 따른 방송 재생 장치의 구성을 도시한 블록도이다.
도 3에 따르면, 방송 재생 장치(300)는 역패킷화부(310), 비디오 복호화부(320), 오디오 복호화부(330), 멀티 채널 오디오 신호 판별부(340), 및 다운믹스부(350)를 포함할 수 있다.
역패킷화부(310)는 비트스트림을 역다중화 및 역패킷화할 수 있다.
일례로, 역패킷화부(310)는 방송 송신 장치로부터 수신된 비트스트림을 역다중화하여, 비트스트림으로부터 부호화된 멀티 채널 오디오 신호, 부호화된 비디오 신호, 오디오 식별 정보를 추출할 수 있다. 여기서, 오디오 식별 정보는, 하나 이상의 믹싱 정보를 포함할 수도 있다.
그리고, 역패킷화부(310)는 부호화된 멀티 채널 오디오 신호, 부호화된 비디오 신호, 오디오 식별 정보를 각각 역패킷화할 수 있다.
비디오 복호화부(320)는 시그널링 정보에 포함된 비디오 정보에 기초하여 부호화된 비디오 신호를 복호화할 수 있다.
오디오 복호화부(330)는, 시그널링 정보에 포함된 오디오 정보에 기초하여 부호화된 멀티 채널 오디오 신호를 복호화할 수 있다. 여기서, 시그널링 정보는 비트스트림에 포함되어 방송 송신 장치로부터 수신될 수 있다.
멀티 채널 오디오 신호 판별부(340)는 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지 여부를 판별할 수 있다. 여기서, 오디오 식별 정보는 디스크립터 형태일 수 있다.
이때, 멀티 채널 오디오 신호가 서라운드 오디오 신호로 판별된 경우, 오디오 복호화부(330)는 복호화된 멀티 채널 오디오 신호를 그대로 출력할 수 있다.
그리고, 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우, 다운 믹스부(350)는 하나 이상의 믹싱 정보에 기초하여 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다. 여기서, 믹싱 정보는 오디오 식별 정보에 삽입되어 방송 송신 장치로부터 수신될 수도 있고, 사용자 조작을 통해 입력될 수도 있다.
이때, 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보를 이용하는 경우, 다운 믹스부(350)는 하나 이상의 믹싱 정보 중 디폴트(default)로 설정된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
일례로, 오디오 식별 정보에 음성(Voice):악기 1:악기 2:가 1:1:1로 믹싱하는 믹싱 정보 1, 음성:악기 1:악기 2:가 1:0:1로 믹싱하는 믹싱 정보 2, 및 음성:악기 1:악기 2:가 1:1:0으로 믹싱하는 믹싱 정보 3가 포함되고, 믹싱 정보 1이 디폴트로 기설정된 경우, 다운 믹스부(350)는 디폴트로 설정된 믹싱 정보 1에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
다른 예로, 믹싱 정보 1, 믹싱 정보 2, 및 믹싱 정보 3 중 사용자 조작을 통해 믹싱 정보 3이 선택된 경우, 다운 믹스부(350)는 믹싱 정보 3에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
또한, 오디오 식별 정보에 하나 이상의 믹싱 정보가 포함되고, 사용자 조작을 통해 믹싱 정보가 입력되는 경우, 다운 믹스부(350)는 사용자 조작을 통해 입력된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
일례로, 사용자가 믹싱 정보 1 내지 믹싱 정보 3에 믹싱하기를 원하지 않고 특정 비율로 믹싱하기를 원하는 경우, 사용자는 방송 재생 장치에 마련된 조작부(미도시) 또는 리모콘 등을 이용하여 음성:악기 1:악기 2를 믹싱하고자 하는 믹싱 정보를 입력할 수 있다. 이때, 사용자로부터 음성:악기 1:악기 2를 1:0.5:0.5로 믹싱하는 믹싱 정보가 입력된 경우, 다운 믹스부(350)는 멀티채널 오디오 신호를 1:0.5:0.5로 다운믹스하여 스레오 오디오 신호를 출력할 수 있다.
도 4는 본 발명의 일실시예에 다른 방송 재생 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
먼저, 410 단계에서, 방송 재생 장치는 비트스트림을 역다중화할 수 있다.
일례로, 역다중화를 통해, 방송 재생 장치는 비트스트림으로부터 부호화된 비디오 신호, 부호화된 멀티 채널 오디오 신호, 오디오 식별 정보 중 적어도 하나를 분리할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 오디오 식별 정보는 디스크립터 형태일 수 있다.
이어, 420 단계에서, 방송 재생 장치는 부호화된 비디오 신호, 부호화된 멀티 채널 오디오 신호, 오디오 식별 정보, 를 각각 역패킷화할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 오디오 식별 정보는 디스크립터 형태일 수 있다.
그리고, 430 단계에서, 방송 재생 장치는, 시그널링 정보에 포함된 비디오 정보에 기초하여 부호화된 비디오 신호를 복호화할 수 있다. 여기서, 시그널링 정보는 비디오 정보, 오디오 정보 등을 포함하며, 비트스트림에 포함되어 방송 송신 장치로부터 수신될 수 있다.
이어, 440 단계에서, 방송 재생 장치는 시그널링 정보에 포함된 오디오 정보에 기초하여 부호화된 멀티 채널 오디오 신호를 복호화할 수 있다.
그리고, 450 단계에서, 방송 재생 장치는 오디오 식별 정보를 분석할 수 있다.
이때, 방송 재생 장치는 오디오 식별 정보를 분석하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지 여부를 판별할 수 있다.
이어, 460 단계에서, 오디오 식별 정보의 분석을 통해 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우(460:YES), 470 단계에서, 방송 재생 장치는 하나 이상의 믹싱 정보에 기초하여 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
이때, 방송 재생 장치는, 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보에 따라 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
일례로, 다운 믹스부(350)는 하나 이상의 믹싱 정보 중 디폴트(default)로 설정된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
다른 예로, 방송 재생 장치는 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보 중에서 사용자 조작을 통해 선택된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
또한, 방송 재생 장치는, 사용자 조작을 통해 입력된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다. 즉, 사용자가 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보에 따라 멀티 채널 오디오 신호를 다운믹스하기를 원하지 않는 경우, 방송 재생 장치는 사용자로부터 믹싱 정보를 입력받을 수 있다. 그리고, 방송 재생 장치는, 키버튼, 터치 패널 등의 조작부(미도시) 또는 리모콘 등을 이용하여 사용자로부터 입력받은 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
한편, 480 단계에서, 멀티 채널 오디오 신호가 서라운드 오디오 신호로 판별된 경우(460:NO), 방송 재생 장치는 복호화된 멀티 채널 오디오 신호를 그대로 출력할 수 있다.
이상의 도 6에서, 430 내지 450 단계의 순서는 서로 바뀔 수 있다. 다시 말해, 비디오 신호 및 멀티 채널 오디오 신호를 복호화하고, 오디오 식별 정보를 분석하는 순서는 서로 바뀔 수 있다.
지금까지, 도 3 및 도 4를 참조하여 방송 송신 장치로부터 수신된 비트스트림에 기초하여 멀티 채널 오디오 신호를 복원하거나, 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스하는 구성에 대해 설명하였다. 이외에, 방송 재생 장치는 저장 매체에 저장된 부호화된 멀티 채널 오디오 신호 및 오디오 식별 정보에 기초하여 스테레오 오디오 신호를 출력하거나, 복호화된 멀티 채널 오디오 신호를 출력할 수도 있다.
이상의 도 1 내지 도 4에서는 비디오 및 오디오 신호를 부호화하고, 오디오 식별 정보를 생성하는 과정에 대해 설명하였으나, 비디오 신호를 처리하는 구성은 생략될 수 있다. 즉, 라디오를 이용하는 경우, 도 1 및 도 2의 방송 송신 장치에서는 비디오 신호를 부호화하는 비디오 부호화부가 생략될 수 있다. 마찬가지로, 도 3 및 도 4의 방송 재생 장치에서는 비디오 신호를 복호화하는 비디오 복호화부가 생략될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 비디오 부호화부
120: 오디오 부호화부
130: 오디오 식별 정보 생성부
140: 패킷화 및 다중화부

Claims (4)

  1. 방송 송신 방법에 있어서,
    멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 단계;
    상기 오디오 식별 정보를 포함하는 멀티 채널 오디오 신호를 송신하는 단계
    를 포함하고,
    상기 객체 기반 오디오 신호는, 복수의 믹싱 정보들 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 다운믹스되거나 또는 사용자 조작을 통해 입력된 믹싱 정보에 따라 다운믹스되고,
    상기 복수의 믹싱 정보들은,
    상기 객체 기반 오디오 신호를 위한 복수의 채널들에 대한 믹싱 정보 및 상기 객체 기반 오디오 신호에 포함된 복수의 객체들에 대한 믹싱 정보를 포함하는 방송 송신 방법.
  2. 제1항에 있어서,
    상기 오디오 식별 정보는,
    상기 오디오 식별 정보를 디스크립터(descriptor) 형태로 PMT에 포함되어 전송되는 특징으로 하는 방송 송신 방법.
  3. 오디오 식별 정보를 포함하는 멀티 채널 오디오 신호를 수신하는 단계
    오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 단계; 및
    상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인 경우, 상기 객체 기반 오디오 신호를 믹싱하는 단계
    를 포함하고,
    상기 객체 기반 오디오 신호는, 복수의 믹싱 정보들 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 다운믹스되거나 또는 사용자 조작을 통해 입력된 믹싱 정보에 따라 다운믹스되고,
    상기 복수의 믹싱 정보들은,
    상기 객체 기반 오디오 신호를 위한 복수의 채널들에 대한 믹싱 정보 및 상기 객체 기반 오디오 신호에 포함된 복수의 객체들에 대한 믹싱 정보를 포함하는 방송 재생 방법.
  4. 제3항에 있어서,
    상기 오디오 식별 정보는,
    상기 오디오 식별 정보를 디스크립터(descriptor) 형태로 PMT에 포함되어 전송되는 특징으로 하는 방송 재생 방법.
KR1020190090301A 2019-07-25 2019-07-25 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 KR20190089830A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020190090301A KR20190089830A (ko) 2019-07-25 2019-07-25 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR1020210027569A KR102471718B1 (ko) 2019-07-25 2021-03-02 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190090301A KR20190089830A (ko) 2019-07-25 2019-07-25 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180087234A Division KR102005929B1 (ko) 2018-07-26 2018-07-26 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020210027569A Division KR102471718B1 (ko) 2019-07-25 2021-03-02 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20190089830A true KR20190089830A (ko) 2019-07-31

Family

ID=67474207

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190090301A KR20190089830A (ko) 2019-07-25 2019-07-25 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20190089830A (ko)

Similar Documents

Publication Publication Date Title
US9257124B2 (en) Apparatus and method for coding and decoding multi-object audio signal with various channel
JP5394931B2 (ja) オブジェクトベースオーディオ信号の復号化方法及びその装置
JP6288100B2 (ja) オーディオエンコード装置及びオーディオデコード装置
EP2278582A2 (en) A method and an apparatus for processing an audio signal
RU2450440C1 (ru) Способ и устройство для обработки аудиосигнала
KR20090082927A (ko) 오디오 신호의 디코딩 방법 및 그 장치
JP2011512554A (ja) オーディオ信号のフィンガープリントを計算するための装置及び方法、同期のための装置及び方法、並びに試験オーディオ信号の特徴付けのための装置及び方法
US10657978B2 (en) Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method
KR102005929B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR102471718B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR20190089830A (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR20170096984A (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR20100085861A (ko) 오디오 신호 처리 방법 및 장치
KR20080034074A (ko) 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X601 Decision of rejection after re-examination
A107 Divisional application of patent
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2021101000521; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20210302

Effective date: 20210810