WO2012087042A2 - 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 - Google Patents

객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 Download PDF

Info

Publication number
WO2012087042A2
WO2012087042A2 PCT/KR2011/009971 KR2011009971W WO2012087042A2 WO 2012087042 A2 WO2012087042 A2 WO 2012087042A2 KR 2011009971 W KR2011009971 W KR 2011009971W WO 2012087042 A2 WO2012087042 A2 WO 2012087042A2
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
audio
identification information
mixing
broadcast
Prior art date
Application number
PCT/KR2011/009971
Other languages
English (en)
French (fr)
Other versions
WO2012087042A3 (ko
Inventor
이용주
이태진
강경옥
김진웅
안치득
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US13/996,852 priority Critical patent/US9412384B2/en
Priority to EP11849915.1A priority patent/EP2658253A4/en
Publication of WO2012087042A2 publication Critical patent/WO2012087042A2/ko
Publication of WO2012087042A3 publication Critical patent/WO2012087042A3/ko
Priority to US15/230,616 priority patent/US10217473B2/en
Priority to US16/262,144 priority patent/US10657978B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/95Arrangements characterised by the broadcast information itself characterised by a specific format, e.g. MP3 (MPEG-1 Audio Layer 3)
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Definitions

  • the present invention is directed to a technique for providing object-based audio using multi-channel audio encoding and decoding.
  • the object-based audio service is an audio audio service that allows a user to control and listen to various sound sources included in the audio.
  • music has a form in which a musical instrument such as a guitar, a piano, a bass, etc., and a voice of a vocal are mixed.
  • the object-based audio service unlike general audio, can independently encode, store, or transmit various instruments and singers' voices without mixing. Accordingly, when using the object-based audio service, the playback terminal can individually control only the voice of each instrument or vocal.
  • encoding and decoding are independently performed for each audio object. Accordingly, there is a difficulty that is not compatible with broadcasting systems such as DTV (Digital Television), DMB (Digital Multimedia Broadcasting), DAB (Digital Audio Broadcasting), and the like. In other words, there is a difficulty in controlling an audio signal for each object in a broadcast transmission and reproduction apparatus such as a DTV, a DMB, and a DAB.
  • DTV Digital Television
  • DMB Digital Multimedia Broadcasting
  • DAB Digital Audio Broadcasting
  • the present invention provides a broadcast transmitting apparatus and method, and a broadcast reproducing apparatus and method capable of providing object-based audio services in a broadcasting system such as DTV, DMB, DAB, etc. using audio identification information.
  • a broadcast transmission apparatus includes an audio encoder for encoding a multichannel audio signal, and an audio identification information generator for generating audio identification information for identifying whether the multichannel audio signal is an object-based audio signal. It may include.
  • the apparatus may further include a video encoder that encodes a video signal.
  • the apparatus may further include a packetization and multiplexing unit for packetizing and multiplexing the audio identification information, the mixing information, and the encoded multichannel audio signal.
  • the audio identification information generator may generate one or more mixing information including a method of mixing each channel when the multichannel audio signal is an object-based audio signal.
  • the audio identification information generator may generate the audio identification information in the form of a descriptor.
  • the broadcast transmission method may include encoding a multi-channel audio signal, and generating audio identification information for identifying whether the multi-channel audio signal is an object-based audio signal.
  • the method may further include packetizing and multiplexing the audio identification information, the mixing information, and the encoded audio signal.
  • a broadcast reproducing apparatus includes: a multi-channel audio signal determination unit for determining whether a multi-channel audio signal is an object-based audio signal based on audio identification information extracted from a bitstream, and encoded multi-channel audio It may include an audio decoder to decode the signal.
  • the downmixer may downmix the multichannel audio signal to a stereo audio signal according to mixing information set as default among the input mixing information.
  • the downmixer may downmix the multichannel audio signal to a stereo audio signal according to any mixing information selected through a user manipulation among the input mixing information. have.
  • the downmixer may downmix the multichannel audio signal to a stereo audio signal according to mixing information input through a user manipulation.
  • a broadcast reproduction method may include determining whether a multichannel audio signal is an object-based audio signal based on audio identification information, and decoding the encoded multichannel audio signal. .
  • an object-based audio service can be provided in a broadcasting system such as DTV, DMB, DAB, etc. by using audio identification information for identifying whether a multi-channel audio signal is a surround audio signal or an object-based audio signal.
  • FIG. 1 is a block diagram showing the configuration of a broadcast transmission apparatus according to an embodiment of the present invention.
  • FIG. 2 is a flowchart provided to explain an operation of a broadcast transmission apparatus according to an embodiment of the present invention.
  • FIG. 3 is a block diagram showing a configuration of a broadcast reproducing apparatus according to another embodiment of the present invention.
  • FIG. 4 is a flowchart provided to explain an operation of a broadcast reproducing apparatus according to an embodiment of the present invention.
  • FIG. 1 is a block diagram showing the configuration of a broadcast transmission apparatus according to an embodiment of the present invention.
  • the broadcast transmission apparatus 100 may include a video encoder 110, an audio encoder 120, an audio identification information generator 130, and a packetization and multiplexer 140.
  • the video encoder 110 may encode a video signal using various compression algorithms such as MPEG.
  • the audio encoder 120 may encode a multi-channel audio signal.
  • the audio identification information generator 130 may generate audio identification information for identifying whether the multi-channel audio signal is a surround audio signal or an object-based audio signal.
  • the audio identification information generation unit 130 may generate the audio identification information in the form of a descriptor. Then, the descriptor-type sig audio identification information may be inserted into the PMT of the MPEG-2 TS and transmitted to the broadcast reproducing apparatus.
  • the audio identification information generation unit 130 may generate one or more mixing information including a method of mixing each channel.
  • the audio identification information generator 130 may generate audio identification information in which mixing information is inserted.
  • the audio identification information generation unit 130 may generate audio identification information in which the mixing information is inserted in the form of a descriptor.
  • the audio identification information generation unit 130 mixes voice: instrument 1: instrument 2 into 1: 1: 1 ( Mixing information 1, voice: musical instrument 1: instrument 2, 1: 0: 1 mixing information 2, voice: musical instrument 1: mixing information 3 to mix 1: 2: 1: 1: 0 can be created have.
  • the audio identification information generation unit 130 may insert the mixing information 1, the mixing information 2, and the mixing information 3 into the audio identification information and generate the mixing information.
  • any one of the mixing information 1 to the mixing information 3 may be preset as a default.
  • the packetization and multiplexer 140 may packetize the encoded video signal, the encoded audio signal, and the audio identification information, respectively.
  • the packetization and multiplexer 140 may generate one bitstream by multiplexing the packetized video signal, the packetized audio signal, and the packetized audio identification information. Then, the broadcast transmission device 100 may transmit the bitstream to the broadcast reproduction device.
  • the broadcast transmission apparatus of FIG. 1 described above may store encoded multi-channel audio signals and audio identification information in a storage medium such as a USB, an external hard disk, a Blu-ray disk, or a DBD.
  • the broadcast transmission device may store the audio identification information in a storage medium in the form of a descriptor.
  • the broadcast transmission apparatus described with reference to FIG. 1 may be a portable terminal providing a DTV, a DMB, a DAB, a home terminal, a vehicle terminal, or the like.
  • FIG. 2 is a flowchart provided to explain an operation of a broadcast transmission apparatus according to an embodiment of the present invention.
  • the broadcast transmission device may encode a video signal using an image compression algorithm such as MPEG-2 or HEVC.
  • the broadcast transmission device may encode a multi-channel audio signal by using an audio compression algorithm such as AC-3 (Advanced Coding-3), AAC (Advanced Audio Coding), or BSAC (Bit-Sliced Arithmetic Coding).
  • AC-3 Advanced Coding-3
  • AAC Advanced Audio Coding
  • BSAC Bit-Sliced Arithmetic Coding
  • the broadcast transmission device may generate audio identification information for identifying whether the multi-channel audio signal is an object-based audio signal or a surround audio signal.
  • the broadcast transmission device may generate audio identification information in the form of a descriptor.
  • the broadcast transmission device may generate one or more mixing information including a method of mixing each channel. If the multichannel audio signal is an object-based audio signal, the broadcast transmission device may generate audio identification information in which mixing information is inserted. In this case, the broadcast transmission device may generate audio identification information in which the mixing information is inserted in the form of a descriptor.
  • the broadcast transmission device may packetize the audio identification information, the encoded video signal, and the encoded audio signal.
  • the broadcast transmission device may generate a bitstream by multiplexing the packetized audio identification information, the packetized video signal, and the packetized audio signal.
  • the order of steps 210 to 230 may be interchanged.
  • the order of encoding the video signal and the multi-channel audio signal and generating audio identification information may be interchanged.
  • the broadcast transmission device may store the encoded multi-channel audio signal and audio identification information in a storage medium.
  • the audio identification information may include one or more mixing information.
  • the audio identification information stored in the storage medium may be in the form of a descriptor.
  • FIG. 3 is a block diagram showing a configuration of a broadcast reproducing apparatus according to another embodiment of the present invention.
  • the broadcast reproducing apparatus 300 includes an inverse packetizer 310, a video decoder 320, an audio decoder 330, a multi-channel audio signal determiner 340, and a downmixer 350. It may include.
  • the depacketizer 310 may demultiplex and depacket the bitstream.
  • the depacketizer 310 may demultiplex the bitstream received from the broadcast transmission apparatus, and extract the encoded multi-channel audio signal, the encoded video signal, and the audio identification information from the bitstream.
  • the audio identification information may include one or more mixing information.
  • the depacketizer 310 may depacketize the encoded multi-channel audio signal, the encoded video signal, and the audio identification information, respectively.
  • the video decoder 320 may decode the encoded video signal based on the video information included in the signaling information.
  • the audio decoder 330 may decode the encoded multichannel audio signal based on the audio information included in the signaling information.
  • the signaling information may be included in the bitstream and received from the broadcast transmission device.
  • the multi-channel audio signal determiner 340 may determine whether the multi-channel audio signal is an object based audio signal or a surround audio signal based on the audio identification information.
  • the audio identification information may be in the form of a descriptor.
  • the audio decoder 330 may output the decoded multi-channel audio signal as it is.
  • the down mix unit 350 may downmix the multi-channel audio signal into a stereo audio signal based on one or more mixing information.
  • the mixing information may be inserted into the audio identification information and received from the broadcast transmission device or may be input through a user operation.
  • the down mix unit 350 downmixes the multi-channel audio signal into a stereo audio signal according to the mixing information set as a default among the one or more mixing information. downmix).
  • the multichannel audio signal can be downmixed into a stereo audio signal.
  • the down mix unit 350 downmixes the multichannel audio signal into the stereo audio signal according to the mixing information 3. can do.
  • the downmixing unit 350 converts the multichannel audio signal into a stereo audio signal according to the mixing information input through the user operation. Downmix.
  • the user may use a control unit (not shown) or a remote controller provided in the broadcast reproduction device to perform voice: instrument 1: You can enter the mixing information you want to mix Instrument 2.
  • instrument 1 instrument 2 into 1: 0.5: 0.5 is input from the user
  • the downmixing unit 350 downmixes the multichannel audio signal to 1: 0.5: 0.5 and sets the stereo. Audio signals can be output.
  • FIG. 4 is a flowchart provided to explain an operation of a broadcast reproducing apparatus according to an embodiment of the present invention.
  • the broadcast reproducing apparatus may demultiplex the bitstream.
  • the broadcast reproducing apparatus may separate at least one of an encoded video signal, an encoded multichannel audio signal, and audio identification information from the bitstream.
  • the audio identification information may include one or more mixing information.
  • the audio identification information may be in the form of a descriptor.
  • the broadcast reproducing apparatus may depacketize the encoded video signal, the encoded multi-channel audio signal, and the audio identification information, respectively.
  • the audio identification information may include one or more mixing information.
  • the audio identification information may be in the form of a descriptor.
  • the broadcast reproducing apparatus may decode the encoded video signal based on the video information included in the signaling information.
  • the signaling information includes video information, audio information, and the like, and may be included in a bitstream and received from a broadcast transmission device.
  • the broadcast reproducing apparatus may decode the encoded multichannel audio signal based on the audio information included in the signaling information.
  • the broadcast reproducing apparatus may analyze the audio identification information.
  • the broadcast reproducing apparatus may analyze the audio identification information to determine whether the multi-channel audio signal is an object-based audio signal or a surround audio signal.
  • the broadcast reproducing apparatus uses the multi-channel audio based on one or more mixing information.
  • the signal can be downmixed to a stereo audio signal.
  • the broadcast reproducing apparatus may downmix the multi-channel audio signal into the stereo audio signal according to one or more mixing information included in the audio identification information.
  • the down mix unit 350 may downmix a multichannel audio signal to a stereo audio signal according to mixing information set as default among one or more mixing information.
  • the broadcast reproducing apparatus may downmix the multichannel audio signal into the stereo audio signal according to the mixing information selected through user manipulation among one or more mixing information included in the audio identification information.
  • the broadcast reproducing apparatus may downmix the multichannel audio signal into the stereo audio signal according to the mixing information input through a user operation. That is, when the user does not want to downmix the multi-channel audio signal according to one or more mixing information included in the audio identification information, the broadcast reproduction apparatus may receive the mixing information from the user.
  • the broadcast reproducing apparatus may downmix the multichannel audio signal into the stereo audio signal according to the mixing information input from the user by using an operation unit (not shown) such as a key button or a touch panel or a remote controller.
  • the broadcast reproducing apparatus may output the decoded multi-channel audio signal as it is.
  • the order of steps 430 to 450 may be interchanged. In other words, the order of decoding the video signal and the multi-channel audio signal and analyzing the audio identification information may be reversed.
  • the broadcast reproducing apparatus may output a stereo audio signal or a decoded multichannel audio signal based on the encoded multichannel audio signal and the audio identification information stored in the storage medium.
  • the configuration for processing the video signal may be omitted. That is, in the case of using the radio, the video encoding unit encoding the video signal may be omitted in the broadcast transmission apparatus of FIGS. 1 and 2. Similarly, in the broadcast reproducing apparatus of FIGS. 3 and 4, the video decoder which decodes the video signal may be omitted.

Abstract

멀티 채널 오디오 부호화 및 복호화를 이용하여 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법이 제공된다. 방송 송신 장치는 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하기 위한 오디오 식별 정보를 생성할 수 있다. 그러면, 방송 재생 장치는 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인 경우, 멀티 채널 오디오 신호를 채널 별로 제어하여 출력할 수 있다.

Description

객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
본 발명은 멀티 채널 오디오 부호화 및 복호화를 이용하여 객체 기반 오디오를 제공하는 기술에 과한 것이다.
객체 기반 오디오 서비스는 오디오 내에 포함된 여러 음원들을 사용자가 제어하면서 청취할 수 있는 오디오디오 서비스이다. 일반적으로, 음악은 기타, 피아노, 베이스 등의 악기와 보컬의 목소리 등이 믹싱(mixing)된 형태를 갖는다. 특히, 객체기반 오디오 서비스는 일반적인 오디오와 달리 여러가지 악기와 가수의 목소리 등을 믹싱하지 않고 독립적으로 부호화하거나, 저장/전송할 수 있다. 이에 따라, 객체 기반 오디오 서비스를 이용하는 경우, 재생 단말은 각 악기나 보컬의 목소리 만을 개별적으로 제어할 수 있다.
그런데, 객체 기반 오디오 서비스의 경우, 오디오 객체 별로 독립적으로 부호화 및 복호화가 이루어진다. 이에 따라, DTV(Digital Television), DMB(Digital Multimedia Broadcasting), DAB(Digital Audio Broadcasting) 등의 방송 시스템과는 호환되지 않는 어려움이 있다. 다시 말해, DTV, DMB, DAB 등의 방송 송신 및 재생 장치에서는 객체 별로 오디오 신호를 제어하는 데 어려움이 존재한다.
따라서, DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있는 기술이 필요하다.
본 발명은 오디오 식별 정보를 이용하여 DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 방송 송신 장치는, 멀티 채널 오디오 신호를 부호화하는 오디오 부호화부, 및 상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 오디오 식별 정보 생성부를 포함할 수 있다.
또한, 비디오 신호를 부호화하는 비디오 부호화부를 더 포함할 수 있다.
또한, 상기 오디오 식별 정보, 믹싱 정보, 및 부호화된 멀티 채널 오디오 신호를 패킷화 및 다중화하는 패킷화 및 다중화부를 더 포함할 수 있다.
또한, 상기 오디오 식별 정보 생성부는, 상기 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다.
또한, 상기 오디오 식별 정보 생성부는, 상기 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
본 발명의 일실시예에 따른 방송 송신 방법은, 멀티 채널 오디오 신호를 부호화하는 단계, 및 상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 단계를 포함할 수 있다.
또한, 상기 오디오 식별 정보, 믹싱 정보, 및 부호화된 오디오 신호를 패킷화 및 다중화 하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따른 방송 재생 장치는, 비트스트림으로부터 추출된 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 멀티 채널 오디오 신호 판별부, 및 부호화된 멀티 채널 오디오 신호를 복호화하는 오디오 복호화부를 포함할 수 있다.
또한, 하나 이상의 믹싱 정보가 입력되는 경우, 상기 다운 믹스부는, 입력된 믹싱 정보 중 디폴트(default) 로 설정된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
또한, 하나 이상의 믹싱 정보가 입력되는 경우, 상기 다운믹스부는, 입력된 믹싱 정보 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
또한, 상기 다운믹스부는, 사용자 조작을 통해 입력된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
본 발명의 일실시예에 따른 방송 재생 방법은, 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 단계, 및 부호화된 멀티 채널 오디오 신호를 복호화하는 단계를 포함할 수 있다.
본 발명에 따르면, 멀티 채널 오디오 신호가 서라운드 오디오 신호인지, 또는 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 이용하여 DTV, DMB, DAB 등의 방송 시스템에서 객체 기반 오디오 서비스를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 방송 송신 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 방송 송신 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 방송 재생 장치의 구성을 도시한 블록도이다.
도 4는 본 발명의 일실시예에 따른 방송 재생 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
이하에서, 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 방송 송신 장치의 구성을 도시한 블록도이다.
도 1에 따르면, 방송 송신 장치(100)는 비디오 부호화부(110), 오디오 부호화부(120), 오디오 식별 정보 생성부(130), 및 패킷화 및 다중화부(140)를 포함할 수 있다.
비디오 부호화부(110)는 MPEG 등의 다양한 압축 알고리즘을 이용하여 비디오 신호를 부호화할 수 있다.
오디오 부호화부(120)는 멀티 채널 오디오 신호를 부호화할 수 있다.
오디오 식별 정보 생성부(130)는 멀티 채널 오디오 신호가 서라운드(surround) 오디오 신호인지, 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성할 수 있다.
이때, 오디오 식별 정보 생성부(130)는 오디오 식별 정보를 디스크립터(descriptor) 형태로 생성할 수 있다. 그러면, 디스크립터 형태의 시그 오디오 식별 정보는 MPEG-2 TS의 PMT에 삽입되어 방송 재생 장치로 전송될 수 있다.
또한, 오디오 식별 정보 생성부(130)는, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다. 이때, 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 오디오 식별 정보 생성부(130)는 믹싱 정보가 삽입된 오디오 식별 정보를 생성할 수 있다. 마찬가지로, 오디오 식별 정보 생성부(130)는 믹싱 정보가 삽입된 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
일례로, 가수 등의 음성(voice), 악기 1, 악기 2에 대한 믹싱 정보를 생성하는 경우, 오디오 식별 정보 생성부(130)는 음성:악기 1:악기 2를 1:1:1로 믹싱(Mixing)하는 믹싱 정보 1, 음성:악기 1:악기 2를 1:0:1로 믹싱하는 믹싱 정보 2, 음성:악기 1:악기 2를 1:1:0으로 믹싱하는 믹싱 정보 3을 생성할 수 있다. 그리고, 오디오 식별 정보 생성부(130)는 믹싱 정보 1, 믹싱 정보 2, 및 믹싱 정보 3를 오디오 식별 정보에 삽입하여 생성할 수 있다. 이때, 믹싱 정보 1 내지 믹싱 정보 3 중 어느 하나가 디폴트(default)로 기설정될 수 있다.
패킷화 및 다중화부(140)는 부호화된 비디오 신호, 부호화된 오디오 신호, 및 오디오 식별 정보를 각각 패킷화할 수 있다. 그리고, 패킷화 및 다중화부(140)는 패킷화된 비디오 신호, 패킷화된 오디오 신호, 및 패킷화된 오디오 식별 정보를 다중화하여 하나의 비트스트림을 생성할 수 있다. 그러면, 방송 송신 장치(100)는 비트스트림을 방송 재생 장치로 전송할 수 있다.
이상에서 설명한 도 1의 방송 송신 장치는 부호화된 멀티 채널 오디오 신호와 오디오 식별 정보를 USB, 외장 하드 디스크, 블루레이(Blu-ray) 디스크, DBD 등의 저장 매체에 저장할 수 있다. 이때, 방송 송신 장치는 오디오 식별 정보를 디스크립터 형태로 저장 매체에 저장할 수도 있다.
또한, 도 1에서 설명한 방송 송신 장치로는 DTV, DMB, 및 DAB 등을 제공하는 휴대용 단말, 가정용 단말, 및 차량용 단말 등이 이용될 수 있다.
도 2는 본 발명의 일실시예에 따른 방송 송신 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
먼저, 210 단계에서, 방송 송신 장치는 MPEG-2, HEVC 등의 영상 압축 알고리즘을 이용하여 비디오 신호를 부호화할 수 있다.
이어, 220 단계에서, 방송 송신 장치는 AC-3(Audio Coding-3), AAC(Advanced Audio Coding), BSAC(Bit-Sliced Arithmetic Coding) 등의 오디오 압축 알고리즘 이용하여 멀티 채널 오디오 신호를 부호화할 수 있다.
그리고, 230 단계에서, 방송 송신 장치는 멀티 채널 오디오 신호가 객체 기반 오디오 신호 인지, 서라운드 오디오 신호(surround)인지를 식별하기 위한 오디오 식별 정보를 생성할 수 있다. 일례로, 방송 송신 장치는, 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
이때, 방송 송신 장치는 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성할 수 있다. 그리고,, 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 방송 송신 장치는는 믹싱 정보가 삽입된 오디오 식별 정보를 생성할 수 있다. 이때, 방송 송신 장치는 믹싱 정보가 삽입된 오디오 식별 정보를 디스크립터 형태로 생성할 수 있다.
이어, 240 단계에서, 방송 송신 장치는 오디오 식별 정보, 부호화된 비디오 신호 및 부호화된 오디오 신호를 각각 패킷화할 수 있다. 그리고, 방송 송신 장치는 패킷화된 오디오 식별 정보, 패킷화된 비디오 신호, 및 패킷화된 오디오 신호를 다중화하여 비트스트림을 생성할 수 있다.
이상의 도 2에서, 210 내지 230 단계의 순서는 서로 바뀔 수 있다. 다시 말해, 비디오 신호 및 멀티 채널 오디오 신호를 부호화하고, 오디오 식별 정보를 생성하는 순서는 서로 바뀔 수 있다.
한편, 도 2에서, 방송 송신 장치는 부호화된 멀티 채널 오디오 신호와 오디오 식별 정보를 저장 매체에 저장할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 저장 매체에 저장된 오디오 식별 정보는 디스크립터 형태일 수 있다.
도 3은 본 발명의 다른 실시예에 따른 방송 재생 장치의 구성을 도시한 블록도이다.
도 3에 따르면, 방송 재생 장치(300)는 역패킷화부(310), 비디오 복호화부(320), 오디오 복호화부(330), 멀티 채널 오디오 신호 판별부(340), 및 다운믹스부(350)를 포함할 수 있다.
역패킷화부(310)는 비트스트림을 역다중화 및 역패킷화할 수 있다.
일례로, 역패킷화부(310)는 방송 송신 장치로부터 수신된 비트스트림을 역다중화하여, 비트스트림으로부터 부호화된 멀티 채널 오디오 신호, 부호화된 비디오 신호, 오디오 식별 정보를 추출할 수 있다. 여기서, 오디오 식별 정보는, 하나 이상의 믹싱 정보를 포함할 수도 있다.
그리고, 역패킷화부(310)는 부호화된 멀티 채널 오디오 신호, 부호화된 비디오 신호, 오디오 식별 정보를 각각 역패킷화할 수 있다.
비디오 복호화부(320)는 시그널링 정보에 포함된 비디오 정보에 기초하여 부호화된 비디오 신호를 복호화할 수 있다.
오디오 복호화부(330)는, 시그널링 정보에 포함된 오디오 정보에 기초하여 부호화된 멀티 채널 오디오 신호를 복호화할 수 있다. 여기서, 시그널링 정보는 비트스트림에 포함되어 방송 송신 장치로부터 수신될 수 있다.
멀티 채널 오디오 신호 판별부(340)는 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지 여부를 판별할 수 있다. 여기서, 오디오 식별 정보는 디스크립터 형태일 수 있다.
이때, 멀티 채널 오디오 신호가 서라운드 오디오 신호로 판별된 경우, 오디오 복호화부(330)는 복호화된 멀티 채널 오디오 신호를 그대로 출력할 수 있다.
그리고, 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우, 다운 믹스부(350)는 하나 이상의 믹싱 정보에 기초하여 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다. 여기서, 믹싱 정보는 오디오 식별 정보에 삽입되어 방송 송신 장치로부터 수신될 수도 있고, 사용자 조작을 통해 입력될 수도 있다.
이때, 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보를 이용하는 경우, 다운 믹스부(350)는 하나 이상의 믹싱 정보 중 디폴트(default)로 설정된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
일례로, 오디오 식별 정보에 음성(Voice):악기 1:악기 2:가 1:1:1로 믹싱하는 믹싱 정보 1, 음성:악기 1:악기 2:가 1:0:1로 믹싱하는 믹싱 정보 2, 및 음성:악기 1:악기 2:가 1:1:0으로 믹싱하는 믹싱 정보 3가 포함되고, 믹싱 정보 1이 디폴트로 기설정된 경우, 다운 믹스부(350)는 디폴트로 설정된 믹싱 정보 1에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
다른 예로, 믹싱 정보 1, 믹싱 정보 2, 및 믹싱 정보 3 중 사용자 조작을 통해 믹싱 정보 3이 선택된 경우, 다운 믹스부(350)는 믹싱 정보 3에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
또한, 오디오 식별 정보에 하나 이상의 믹싱 정보가 포함되고, 사용자 조작을 통해 믹싱 정보가 입력되는 경우, 다운 믹스부(350)는 사용자 조작을 통해 입력된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
일례로, 사용자가 믹싱 정보 1 내지 믹싱 정보 3에 믹싱하기를 원하지 않고 특정 비율로 믹싱하기를 원하는 경우, 사용자는 방송 재생 장치에 마련된 조작부(미도시) 또는 리모콘 등을 이용하여 음성:악기 1:악기 2를 믹싱하고자 하는 믹싱 정보를 입력할 수 있다. 이때, 사용자로부터 음성:악기 1:악기 2를 1:0.5:0.5로 믹싱하는 믹싱 정보가 입력된 경우, 다운 믹스부(350)는 멀티채널 오디오 신호를 1:0.5:0.5로 다운믹스하여 스레오 오디오 신호를 출력할 수 있다.
도 4는 본 발명의 일실시예에 다른 방송 재생 장치의 동작을 설명하기 위해 제공되는 흐름도이다.
먼저, 410 단계에서, 방송 재생 장치는 비트스트림을 역다중화할 수 있다.
일례로, 역다중화를 통해, 방송 재생 장치는 비트스트림으로부터 부호화된 비디오 신호, 부호화된 멀티 채널 오디오 신호, 오디오 식별 정보 중 적어도 하나를 분리할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 오디오 식별 정보는 디스크립터 형태일 수 있다.
이어, 420 단계에서, 방송 재생 장치는 부호화된 비디오 신호, 부호화된 멀티 채널 오디오 신호, 오디오 식별 정보, 를 각각 역패킷화할 수 있다. 여기서, 오디오 식별 정보는 하나 이상의 믹싱 정보를 포함할 수도 있다. 이때, 오디오 식별 정보는 디스크립터 형태일 수 있다.
그리고, 430 단계에서, 방송 재생 장치는, 시그널링 정보에 포함된 비디오 정보에 기초하여 부호화된 비디오 신호를 복호화할 수 있다. 여기서, 시그널링 정보는 비디오 정보, 오디오 정보 등을 포함하며, 비트스트림에 포함되어 방송 송신 장치로부터 수신될 수 있다.
이어, 440 단계에서, 방송 재생 장치는 시그널링 정보에 포함된 오디오 정보에 기초하여 부호화된 멀티 채널 오디오 신호를 복호화할 수 있다.
그리고, 450 단계에서, 방송 재생 장치는 오디오 식별 정보를 분석할 수 있다.
이때, 방송 재생 장치는 오디오 식별 정보를 분석하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지 여부를 판별할 수 있다.
이어, 460 단계에서, 오디오 식별 정보의 분석을 통해 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우(460:YES), 470 단계에서, 방송 재생 장치는 하나 이상의 믹싱 정보에 기초하여 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
이때, 방송 재생 장치는, 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보에 따라 멀티 채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
일례로, 다운 믹스부(350)는 하나 이상의 믹싱 정보 중 디폴트(default)로 설정된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)할 수 있다.
다른 예로, 방송 재생 장치는 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보 중에서 사용자 조작을 통해 선택된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
또한, 방송 재생 장치는, 사용자 조작을 통해 입력된 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다. 즉, 사용자가 오디오 식별 정보에 포함된 하나 이상의 믹싱 정보에 따라 멀티 채널 오디오 신호를 다운믹스하기를 원하지 않는 경우, 방송 재생 장치는 사용자로부터 믹싱 정보를 입력받을 수 있다. 그리고, 방송 재생 장치는, 키버튼, 터치 패널 등의 조작부(미도시) 또는 리모콘 등을 이용하여 사용자로부터 입력받은 믹싱 정보에 따라 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스할 수 있다.
한편, 480 단계에서, 멀티 채널 오디오 신호가 서라운드 오디오 신호로 판별된 경우(460:NO), 방송 재생 장치는 복호화된 멀티 채널 오디오 신호를 그대로 출력할 수 있다.
이상의 도 6에서, 430 내지 450 단계의 순서는 서로 바뀔 수 있다. 다시 말해, 비디오 신호 및 멀티 채널 오디오 신호를 복호화하고, 오디오 식별 정보를 분석하는 순서는 서로 바뀔 수 있다.
지금까지, 도 3 및 도 4를 참조하여 방송 송신 장치로부터 수신된 비트스트림에 기초하여 멀티 채널 오디오 신호를 복원하거나, 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스하는 구성에 대해 설명하였다. 이외에, 방송 재생 장치는 저장 매체에 저장된 부호화된 멀티 채널 오디오 신호 및 오디오 식별 정보에 기초하여 스테레오 오디오 신호를 출력하거나, 복호화된 멀티 채널 오디오 신호를 출력할 수도 있다.
이상의 도 1 내지 도 4에서는 비디오 및 오디오 신호를 부호화하고, 오디오 식별 정보를 생성하는 과정에 대해 설명하였으나, 비디오 신호를 처리하는 구성은 생략될 수 있다. 즉, 라디오를 이용하는 경우, 도 1 및 도 2의 방송 송신 장치에서는 비디오 신호를 부호화하는 비디오 부호화부가 생략될 수 있다. 마찬가지로, 도 3 및 도 4의 방송 재생 장치에서는 비디오 신호를 복호화하는 비디오 복호화부가 생략될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (16)

  1. 멀티 채널 오디오 신호를 부호화하는 오디오 부호화부; 및
    상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 오디오 식별 정보 생성부
    를 포함하는 방송 송신 장치.
  2. 제1항에 있어서,
    상기 오디오 식별 정보 생성부는,
    상기 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성하는 것을 특징으로 하는 방송 송신 장치.
  3. 제1항에 있어서,
    상기 오디오 식별 정보 생성부는,
    상기 오디오 식별 정보를 디스크립터(descriptor) 형태로 생성하는 것을 특징으로 하는 방송 송신 장치.
  4. 멀티 채널 오디오 신호를 부호화하는 단계; 및
    상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 식별하는 오디오 식별 정보를 생성하는 단계;
    를 포함하는 방송 송신 방법.
  5. 제4항에 있어서,
    상기 오디오 식별 정보를 생성하는 단계는,
    상기 멀티채널 오디오 신호가 객체기반 오디오 신호인 경우, 각 채널을 믹싱하는 방식을 포함하는 믹싱 정보를 하나 이상 생성하는 것을 특징으로 하는 방송 송신 방법.
  6. 제4항에 있어서,
    상기 오디오 식별 정보를 생성하는 단계는,
    상기 오디오 식별 정보를 디스크립터(descriptor) 형태로 생성하는 것을 특징으로 하는 방송 송신 방법.
  7. 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 멀티 채널 오디오 신호 판별부; 및
    부호화된 멀티 채널 오디오 신호를 복호화하는 오디오 복호화부
    를 포함하는 방송 재생 장치.
  8. 제 7항에 있어서,
    상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우, 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 다운 믹스부
    를 더 포함하는 방송 재생 장치
  9. 제 8항에 있어서,
    상기 다운믹스부는,
    하나 이상의 믹싱 정보가 입력되는 경우, 입력된 믹싱 정보 중 디폴트(default) 로 설정된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 것을 특징으로 하는 방송 재생 장치
  10. 제 8항에 있어서,
    상기 다운믹스부는,
    하나 이상의 믹싱 정보가 입력되는 경우, 입력된 믹싱 정보 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 것을 특징으로 하는 방송 재생 장치
  11. 제 8항에 있어서,
    상기 다운믹스부는,
    사용자 조작을 통해 입력된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 것을 특징으로 하는 방송 재생 장치
  12. 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지를 판별하는 단계; 및
    부호화된 멀티 채널 오디오 신호를 복호화하는 단계
    를 포함하는 방송 재생 방법.
  13. 제12항에 있어서,
    상기 멀티 채널 오디오 신호가 객체 기반 오디오 신호로 판별된 경우, 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 단계
    를 더 포함하는 방송 재생 방법.
  14. 제13항에 있어서,
    상기 다운믹스 단계는,
    하나 이상의 믹싱 정보가 입력되는 경우, 입력된 믹싱 정보 중 디폴트로 설정된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 것을 특징으로 하는 를 더 포함하는 방송 재생 방법.
  15. 제 13항에 있어서,
    상기 다운믹스 단계는,
    하나 이상의 믹싱 정보가 입력되는 경우, 입력된 믹싱 정보 중 사용자 조작을 통해 선택된 어느 하나의 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 것을 특징으로 하는 방송 재생 방법
  16. 제 13항에 있어서,
    상기 다운믹스 단계는,
    사용자 조작을 통해 입력된 믹싱 정보에 따라 상기 멀티채널 오디오 신호를 스테레오 오디오 신호로 다운믹스(downmix)하는 단계를 더 포함하는 것을 특징으로 하는 방송 재생 방법.
PCT/KR2011/009971 2010-12-22 2011-12-22 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 WO2012087042A2 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US13/996,852 US9412384B2 (en) 2010-12-22 2011-12-22 Broadcast transmitting/playback apparatus and method thereof
EP11849915.1A EP2658253A4 (en) 2010-12-22 2011-12-22 AUDIOVISUAL PROGRAM TRANSMISSION APPARATUS AND AUDIOVISUAL PROGRAM TRANSMISSION METHOD FOR PROVIDING AUDIO-BASED AUDIO SIGNAL, AND AUDIOVISUAL PROGRAM PLAYING APPARATUS, AND AUDIOVISUAL PROGRAM PLAYING METHOD
US15/230,616 US10217473B2 (en) 2010-12-22 2016-08-08 Broadcast transmitting/playback apparatus and method thereof
US16/262,144 US10657978B2 (en) 2010-12-22 2019-01-30 Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2010-0132665 2010-12-22
KR1020100132665A KR20120071072A (ko) 2010-12-22 2010-12-22 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US13/996,852 A-371-Of-International US9412384B2 (en) 2010-12-22 2011-12-22 Broadcast transmitting/playback apparatus and method thereof
US15/230,616 Continuation US10217473B2 (en) 2010-12-22 2016-08-08 Broadcast transmitting/playback apparatus and method thereof

Publications (2)

Publication Number Publication Date
WO2012087042A2 true WO2012087042A2 (ko) 2012-06-28
WO2012087042A3 WO2012087042A3 (ko) 2012-09-07

Family

ID=46314644

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/009971 WO2012087042A2 (ko) 2010-12-22 2011-12-22 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Country Status (4)

Country Link
US (3) US9412384B2 (ko)
EP (1) EP2658253A4 (ko)
KR (1) KR20120071072A (ko)
WO (1) WO2012087042A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR20140046980A (ko) 2012-10-11 2014-04-21 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
WO2014058275A1 (ko) * 2012-10-11 2014-04-17 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
EP1908057B1 (en) * 2005-06-30 2012-06-20 LG Electronics Inc. Method and apparatus for decoding an audio signal
KR100733965B1 (ko) 2005-11-01 2007-06-29 한국전자통신연구원 객체기반 오디오 전송/수신 시스템 및 그 방법
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
WO2008039043A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
CN103400583B (zh) * 2006-10-16 2016-01-20 杜比国际公司 多声道下混对象编码的增强编码和参数表示
KR101434834B1 (ko) 2006-10-18 2014-09-02 삼성전자주식회사 다채널 오디오 신호의 부호화/복호화 방법 및 장치
JP5394931B2 (ja) 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
EP2595152A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Transkoding apparatus
KR101003415B1 (ko) 2007-10-17 2010-12-23 엘지전자 주식회사 Dmb 신호의 디코딩 방법 및 이의 디코딩 장치
KR101531510B1 (ko) 2008-11-27 2015-06-26 엘지전자 주식회사 수신 시스템 및 오디오 데이터 처리 방법
US8670576B2 (en) * 2008-01-01 2014-03-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101230691B1 (ko) * 2008-07-10 2013-02-07 한국전자통신연구원 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
KR20110052562A (ko) 2008-07-15 2011-05-18 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
EP2209328B1 (en) * 2009-01-20 2013-10-23 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
MY154078A (en) * 2009-06-24 2015-04-30 Fraunhofer Ges Forschung Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
CN102171754B (zh) * 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
JP4917189B2 (ja) * 2009-09-01 2012-04-18 パナソニック株式会社 デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
KR101391110B1 (ko) * 2009-09-29 2014-04-30 돌비 인터네셔널 에이비 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림
KR101426625B1 (ko) * 2009-10-16 2014-08-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 평균값을 이용하여 다운믹스 신호 표현 및 이 다운믹스 신호 표현과 관련된 파라메트릭 보조 정보에 기초한 업믹스 신호 표현을 제공하기 위해 하나 이상의 조정된 파라미터를 제공하는 장치, 방법 및 컴퓨터 프로그램
JP5719372B2 (ja) * 2009-10-20 2015-05-20 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム
CN102714038B (zh) * 2009-11-20 2014-11-05 弗兰霍菲尔运输应用研究公司 用以基于下混信号表示型态而提供上混信号表示型态的装置、用以提供表示多声道音频信号的位流的装置、方法
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
None
See also references of EP2658253A4

Also Published As

Publication number Publication date
US20130294607A1 (en) 2013-11-07
KR20120071072A (ko) 2012-07-02
EP2658253A4 (en) 2015-06-10
US10657978B2 (en) 2020-05-19
US20160351201A1 (en) 2016-12-01
US9412384B2 (en) 2016-08-09
EP2658253A2 (en) 2013-10-30
WO2012087042A3 (ko) 2012-09-07
US20190164560A1 (en) 2019-05-30
US10217473B2 (en) 2019-02-26

Similar Documents

Publication Publication Date Title
WO2009123409A2 (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
WO2010143907A2 (ko) 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더
WO2014021588A1 (ko) 오디오 신호 처리 방법 및 장치
JP6288100B2 (ja) オーディオエンコード装置及びオーディオデコード装置
US9542951B2 (en) Method and an apparatus for processing an audio signal
US10142757B2 (en) Transmission device, transmission method, reception device, and reception method
WO2011021845A2 (en) Method and apparatus for encoding multi-channel audio signal and method and apparatus for decoding multi-channel audio signal
CN102165520B (zh) 处理信号的方法和装置
WO2009134085A2 (ko) 슈퍼 프레임을 이용하여 멀티채널 오디오 신호를 송수신하는 방법 및 장치
KR20140046980A (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US10657978B2 (en) Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method
KR20080049735A (ko) 오디오 신호의 디코딩 방법 및 장치
KR100636145B1 (ko) 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
KR102370672B1 (ko) 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치
WO2014021586A1 (ko) 오디오 신호 처리 방법 및 장치
WO2013103175A1 (ko) 다채널 신호 부호화 및 복호화 장치 및 방법
KR102471718B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR102005929B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
WO2014058275A1 (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR20090039642A (ko) Dmb 신호의 디코딩 방법 및 이의 디코딩 장치
KR20190089830A (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR20170096984A (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
WO2013073810A1 (ko) 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
WO2015152666A1 (ko) Hoa 신호를 포함하는 오디오 신호를 디코딩하는 방법 및 장치
KR101187075B1 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11849915

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 13996852

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011849915

Country of ref document: EP