KR20190031460A - 오디오 객체 전송 장치 및 방법 - Google Patents

오디오 객체 전송 장치 및 방법 Download PDF

Info

Publication number
KR20190031460A
KR20190031460A KR1020190030000A KR20190030000A KR20190031460A KR 20190031460 A KR20190031460 A KR 20190031460A KR 1020190030000 A KR1020190030000 A KR 1020190030000A KR 20190030000 A KR20190030000 A KR 20190030000A KR 20190031460 A KR20190031460 A KR 20190031460A
Authority
KR
South Korea
Prior art keywords
audio
channel
audio objects
encoding
encoder
Prior art date
Application number
KR1020190030000A
Other languages
English (en)
Inventor
유재현
강경옥
서정일
이태진
최근우
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020190030000A priority Critical patent/KR20190031460A/ko
Publication of KR20190031460A publication Critical patent/KR20190031460A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법이 개시된다.
오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.

Description

오디오 객체 전송 장치 및 방법{APPARATUS AND METHOD FOR TRANSMITTING AUDIO OBJECT}
본 발명은 다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법에 관한 것으로, 보다 상세하게는 복수의 오디오 객체를 다채널 부호화기로 부호화하여 전송함으로써, 복수의 오디오 객체를 용이하게 전송하는 오디오 객체 전송 장치 및 방법에 관한 것이다.
음장 합성(WFS) 재생 기술은 재생하고자 하는 음원의 파면을 합성하여 청취 공간 상의 여러 청취자에게 동일한 음장감을 제공하는 기술이다.
음장 합성 재생 기술에서는 하나의 오디오 장면을 위해서는 많은 개수의 오디오 객체를 필요로 한다. 반면에 음장 합성 신호를 전송하는 전송 매체는 한정된 대역폭을 가지고 있으므로, 오디오 객체의 개수가 증가함에 따라 오디오 객체들을 전송하기 과정의 난이도가 증가하게 된다.
최근 MPEG에서는 SAOC(Spatial Audio Object Coding)으로 많은 객체를 전송하는 방법이 개발되었으나, SAOC는 별도의 코덱을 사용하는 방식이므로, 추가로 별도의 코덱을 구현해야 한다는 한계가 있었다.
따라서, 추가 코덱의 구현 없이 복수의 오디오 객체를 전송할 수 있는 방법이 요청되고 있다.
본 발명은 복수의 오디오 객체를 용이하게 전송하기 위한 장치 및 방법을 제공한다.
또한, 본 발명은 기존의 다채널 부호화기를 사용하여 많은 개수의 오디오 객체들을 부호화하는 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치와, 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 장치는 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 신호 추출부; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 복호화부; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 랜더링부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 방법은 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 방법은 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 단계를 포함할 수 있다.
본 발명의 일실시예에 의하면, 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다.
또한, 본 발명의 일실시예에 의하면, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 도 1에 도시된 바와 같이 오디오 객체 신호에 기반한 음장 합성(WFS: Wave Field Synthesis) 시스템에서 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치(110)와 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치(120)를 포함할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 다채널 부호화기 결정부(111), 부호화부(112), 및 다채널 객체 오디오 신호 생성부(113)를 포함할 수 있다.
다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 오디오 객체는 3차원 효과 음원을 발생하는 객체일 수 있다. 예를 들어 오디오 객체는 기차, 동물과 같이 소리를 발생시키는 오브젝트 및 번개와 같은 자연 현상의 위치를 나타내는 객체일 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 6개인 경우 6개의 채널을 사용하는 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 또한, 다채널 부호화기 결정부(111)는 오디오 객체가 8개인 경우 8개의 채널을 사용하는 7.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
그리고, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 12개인 경우 12개의 채널을 사용하는 10.2 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 그러나, 부호화부(112)가 5.1 채널 부호화기와 7.1 채널 부호화기만을 구비하고 있는 경우, 부호화부(112)는 10.2 채널 부호화기로 오디오 객체를 부호화할 수 없다.
따라서, 다채널 부호화기 결정부(111)는 2개의 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정함으로써, 12개의 오디오 객체를 부호화할 수 있다.
부호화부(112)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
또한, 부호화부(112)는 다채널 부호화기 결정부(111)가 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정한 경우, 복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화할 수 있다.
다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 각 오디오 객체의 방향과 거리와 관련된 정보일 수 있다. 이때, 다채널 객체 오디오 신호 생성부(113)는 복수의 신호를 단일 신호로 출력하는 다중화기(MUX: multiplexer)일 수 있다.
이때, 다채널 객체 오디오 신호 생성부(113)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가할 수도 있다.
즉, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 복호화 장치(120)는 신호 추출부(121), 복호화부(122), 및 랜더링부(123)를 포함할 수 있다.
신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출할 수 있다. 이때, 신호 추출부(121)는 단일 신호를 입력 받아 복수의 신호를 출력하는 역 다중화기(DEMUX: demultiplexer)일 수 있다.
또한, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출할 수 있다.
복호화부(122)는 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
이때, 복호화부(122)는 부호화기 정보에 따른 다채널 복호화기를 사용하여 오디오 객체들을 복호화할 수 있다. 또한, 복호화부(122)는 부호화기 정보에서 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화할 수 있다.
랜더링부(123)는 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부(123)는 사용자 환경 정보를 수신하고, 수신한 사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
오디오 객체 부호화 장치(110)는 도 2에 도시된 바와 같이 6개의 오디오 객체(210)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(220)로 오디오 객체들을 부호화하여 부호화 신호(230)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(240)들을 부호화 신호(230)와 다중화하여 다채널 객체 오디오 신호(250)를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 제1 오디오 객체(211) 내지 제6 오디오 객체(211)의 방향과 거리와 관련된 정보일 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 1개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
오디오 객체 부호화 장치(110)는 도 3에 도시된 바와 같이 12개의 오디오 객체(310)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(320, 325)를 2개 사용하여 오디오 객체들을 부호화하고, 부호화 신호(330, 335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 부호화부(112)는 도 3에 도시된 바와 같이 5.1 채널 부호화기 1(320)과 5.1채널 부호화기 2(325)를 병렬로 사용하여 오디오 객체(310)들을 부호화함으로써, 동시에 12개의 오디오 신호(310)를 부호화할 수 있다. 이때, 5.1 채널 부호화기 1(320)은 제1 오디오 객체(311) 내지 제6 오디오 객체(312)를 부호화하여 부호화 신호(330)를 생성하고, 5.1 채널 부호화기 2(325)는 제7 오디오 객체(313) 내지 제12 오디오 객체(314)를 부호화하여 부호화 신호(335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(340)들을 부호화 신호(330, 335)와 다중화하여 다채널 객체 오디오 신호(350)를 생성할 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 2개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
즉, 본 발명에 따른 오디오 객체 부호화 장치(110)는 10.2 채널부호화기가 없더라도 종래의 5.1 채널 부호화기를 병렬로 사용하여 12개의 오디오 객체를 동시에 부호화할 수 있다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
오디오 객체 복호화 장치(120)의 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호(250)에서 부호화 신호(410)와 오디오 객체들의 음상 정위 정보들(440)을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
이때, 오디오 객체 복호화 장치(120)의 복호화부(122)는 도 4에 도시된 바와 같이 부호화기 정보에 대응하는 5.1 채널 복호화기(420)로 부호화 신호(410)를 복호화하여 6개의 오디오 객체(430)들을 복원할 수 있다.
마지막으로 랜더링부(123)는 음상 정위 정보(440)를 사용하여 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부는 사용자 환경 정보(450)를 수신하고, 수신한 사용자 환경 정보(450)에 따라 음상 정위 정보(440)를 사용하여 오디오 객체(430)들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보(450)는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
단계(S510)에서 다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 부호화부(112)가 사용 가능한 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
단계(S520)에서 부호화부(112)는 단계(S510)에서 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
단계(S530)에서 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 단계(S520)에서 생성한 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
단계(S610)에서 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 부호화 신호와 오디오 객체들의 음상 정위 정보들을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
단계(S620)에서 복호화부(122)는 단계(S610)에서 추출한 부호화기 정보에 대응하는 다채널 복호화기로 단계(S610)에서 추출한 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
단계(S630)에서 랜더링부(123)는 단계(S610)에서 추출한 음상 정위 정보(440)를 사용하여 단계(S620)에서 복원한 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
본 발명은 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 오디오 객체 부호화 장치
111: 다채널 부호화기 결정부
112: 부호화부
113: 다채널 객체 오디오 신호 생성부
120: 오디오 객체 복호화 장치
121: 신호 추출부
122: 복호화부
123: 랜더링부

Claims (9)

  1. 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계;
    결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및
    오디오 객체들의 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계
    를 포함하는 오디오 객체 부호화 방법.
  2. 제1항에 있어서,
    상기 다채널 부호화기를 결정하는 단계는,
    오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  3. 제2항에 있어서,
    상기 부호화 신호를 생성하는 단계는,
    복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  4. 제1항에 있어서,
    상기 다채널 객체 오디오 신호를 생성하는 단계는,
    결정된 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  5. 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계;
    적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및
    오디오 객체들을 랜더링하는 단계
    를 포함하는 오디오 객체 복호화 방법.
  6. 제5항에 있어서,
    상기 신호를 추출하는 단계는,
    수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  7. 제6항에 있어서,
    상기 복원하는 단계는,
    부호화기 정보에 따른 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  8. 제5항에 있어서,
    상기 랜더링하는 단계는
    사용자 환경 정보에 따라 오디오 객체들을 랜더링하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  9. 제8항에 있어서,
    상기 사용자 환경 정보는,
    라우드 스피커의 개수나 위치와 관련된 정보인 것을 특징으로 하는 오디오 객체 복호화 방법.
KR1020190030000A 2019-03-15 2019-03-15 오디오 객체 전송 장치 및 방법 KR20190031460A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190030000A KR20190031460A (ko) 2019-03-15 2019-03-15 오디오 객체 전송 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190030000A KR20190031460A (ko) 2019-03-15 2019-03-15 오디오 객체 전송 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020110147536A Division KR20130093783A (ko) 2011-12-30 2011-12-30 오디오 객체 전송 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20190031460A true KR20190031460A (ko) 2019-03-26

Family

ID=65949784

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190030000A KR20190031460A (ko) 2019-03-15 2019-03-15 오디오 객체 전송 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20190031460A (ko)

Similar Documents

Publication Publication Date Title
KR102131748B1 (ko) 2차원 또는 3차원 음장의 앰비소닉스 표현의 연속 프레임을 인코딩 및 디코딩하는 방법 및 장치
JP5337941B2 (ja) マルチチャネル・パラメータ変換のための装置および方法
KR101387902B1 (ko) 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더
JP2016200824A (ja) トランスコーディング装置
RU2007139922A (ru) Кодирование и декодирование аудио
JP2011008258A (ja) 高品質マルチチャネルオーディオ符号化および復号化装置
KR20090104674A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR20210151741A (ko) 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
KR100636145B1 (ko) 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치
US9312971B2 (en) Apparatus and method for transmitting audio object
KR20130093798A (ko) 다채널 신호 부호화 및 복호화 장치 및 방법
KR20190031460A (ko) 오디오 객체 전송 장치 및 방법
WO2006011367A1 (ja) オーディオ信号符号化装置および復号化装置
KR102191260B1 (ko) 다채널 오디오 코덱과 다객체 오디오 코덱을 이용한 오디오 부호화/복호화 장치 및 방법
KR20100020889A (ko) 오디오 신호 부호화/복호화 방법 및 그 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2020101001028; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20200408

Effective date: 20210319