KR20090047355A - 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조 - Google Patents

오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조 Download PDF

Info

Publication number
KR20090047355A
KR20090047355A KR1020080104938A KR20080104938A KR20090047355A KR 20090047355 A KR20090047355 A KR 20090047355A KR 1020080104938 A KR1020080104938 A KR 1020080104938A KR 20080104938 A KR20080104938 A KR 20080104938A KR 20090047355 A KR20090047355 A KR 20090047355A
Authority
KR
South Korea
Prior art keywords
audio
preset
presets
configuration information
configuration
Prior art date
Application number
KR1020080104938A
Other languages
English (en)
Other versions
KR100999702B1 (ko
Inventor
이태진
강경옥
장대영
홍진우
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20090047355A publication Critical patent/KR20090047355A/ko
Application granted granted Critical
Publication of KR100999702B1 publication Critical patent/KR100999702B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

본 발명은 오디오 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것으로서, 더욱 상세하게는 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것이다.
본 발명에 따른 오디오 프리셋 생성 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 포함한다.
객체기반 오디오 서비스, 프리셋, 오디오 장면

Description

오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조{Method for Generating and Consuming Audio Preset and Apparatus thereof and Computer Readable Medium and File Structure}
본 발명은 오디오 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것으로서, 더욱 상세하게는 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것이다.
종래의 TV 방송, 라디오 방송, 디지털 멀티미디어 방송(DMB: Digital multimedia Broadcasting ) 등과 같은 방송서비스를 통해 제공되는 오디오 신호는 여러 가지 음원으로부터 획득된 오디오 신호가 합성되어 하나의 오디오 신호로 저장/전송된다. 따라서, 사용자는 스피커를 통해 출력되는 전체 오디오 신호의 세기 등을 조절하는 것은 가능하지만, 오디오 신호 내에 포함된 각 음원별 오디오 신호의 세기를 조절할 수 없기 때문에 음원별 오디오 신호의 특성을 제어하는 것은 불 가능했다.
그러나, 콘텐츠를 저작할 때에 각 음원별 오디오 신호를 합성하지 않고 독립적으로 저장하면, 사용자 단말에서는 각 음원별 오디오 신호에 대한 세기 등을 제어할 수 있다. 이러한 개념의 오디오 서비스를 객체기반 오디오 서비스라 한다. 객체기반 오디오 서비스는 여러 개의 오디오 신호를 독립적으로 저장 또는 전송함으로써 사용자의 단말기에서 각각의 오디오 객체에 대한 신호를 적절히 제어하면서 청취(소비)할 수 있다. 객체기반 오디오 서비스의 일 예로는 MPEG(Moving Picture Experts Group)-4 가 있다. 일반적인 멀티 미디어 서비스의 경우 하나의 오디오 객체와 하나의 비디오 객체로 서비스가 이루어지는 경우가 대부분이나, MPEG-4 시스템 규격에서는 여러 개의 객체들을 포함하는 멀티미디어 서비스에 대해 정의하고 있다. 객체기반 오디오 서비스의 경우에도 MPEG-4 시스템에서 정의하고 있는 것과 비슷하게 여러 개의 객체들을 포함하는 멀티미디어 콘텐츠라 할 수 있다.
그러나, 이러한 객체기반 오디오 서비스를 제공하기 위해서는 사용자 단말에서 여러 객체를 각각 처리하여야 하기 때문에 많은 자원(resource)이 필요한 문제점이 있다. 예를 들어, 7개의 오디오 객체로 구성된 객체기반 오디오 콘텐츠인 경우, 사용자가 7개의 오디오 객체를 각각의 오디오 객체에 대해 제어하기 위해서는 사용자 단말에서 7개의 오디오 객체들을 모두 복호화하여야 하기 때문이다. 따라서, 객체기반 오디오 서비스를 위해서는 사용자 단말에서 부호화된 각각의 오 디오 객체를 모두 복호화하여야 하기 때문에, 많은 자원이 필요하게 된다.
특히, 핸드폰, PMP(Portable Multimedia Player), MP3 플레이어와 같은 휴대 단말기에서는 프로세서의 성능과 한정된 자원 등과 같은 제약으로 인해 객체기반 오디오 서비스가 용이하지 않은 문제점이 있다.
따라서, 본 발명은 전술한 문제점을 해결하기 위한 것으로서, 객체기반 오디오 서비스를 효과적으로 제공하고 소비하는 방법과 그 장치 등을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
전술한 과제를 해결하기 위한 본 발명의 일 실시예에 따른 오디오 프리셋 생성 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 포함한다.
본 발명의 다른 실시예에 따른 오디오 프리셋 생성 장치는 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 구성 환 경 제공부, 프리셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 오디오 프리셋 생성부 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 구성 정보 생성부를 포함한다.
본 발명에 따른 또 다른 실시예에 따른 오디오 프리셋 소비 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계, 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계 및 선택된 오디오 프리셋을 복호화하는 단계를 포함한다.
본 발명의 또 다른 실시예에 따른 사용자 단말은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 수신부, 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 선택 환경 제공부 및 선택된 오디오 프리셋을 복호화하는 복호화부를 포함한다.
본 발명의 또 다른 실시예에 따른 오디오 프리셋 생성을 위한 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터로 읽을 수 있는 기록매체에 있어서, 복수의 오디오 객 체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성을 위한 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 수행하는 프로그램을 포함한다.
본 발명의 또 다른 실시예에 따른 오디오 프리셋 소비를 위한 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터로 읽을 수 있는 기록매체에 있어서, 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계, 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계 및 선택된 오디오 프리셋을 복호화하는 단계를 수행하는 프로그램을 포함한다.
본 발명의 또 다른 실시예에 따른 파일 구조는 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋 및 복수의 오디오 프리셋에 대한 구성 정보가 하나의 파일에 포함되고, 구성 정보에 기초하여 복수의 오디오 프리셋 중 어느 하나의 선택을 가능하도록 하는 파일 구조이다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
본 발명에 의하면, 객체기반 오디오 서비스를 효과적으로 제공하고 소비할 수 있다.
이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
또한, 본 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도 되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다.
따라서, 예를 들어, 본 명세서의 블럭도는 본 발명의 원리를 구체화하는 예시적인 회로의 개념적인 관점을 나타내는 것으로 이해되어야 한다. 이와 유사하게, 모든 흐름도, 상태 변환도, 의사 코드 등은 컴퓨터가 판독 가능한 매체에 실질적으로 나타낼 수 있고 컴퓨터 또는 프로세서가 명백히 도시되었는지 여부를 불문하고 컴퓨터 또는 프로세서에 의해 수행되는 다양한 프로세스를 나타내는 것으로 이해되어야 한다.
프로세서 또는 이와 유사한 개념으로 표시된 기능 블럭을 포함하는 도면에 도시된 다양한 소자의 기능은 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 관련하여 소프트웨어를 실행할 능력을 가진 하드웨어의 사용으로 제공될 수 있다. 프로세서에 의해 제공될 때, 상기 기능은 단일 전용 프로세서, 단일 공유 프로세서 또는 복수의 개별적 프로세서에 의해 제공될 수 있고, 이들 중 일부는 공유될 수 있다.
또한 프로세서, 제어 또는 이와 유사한 개념으로 제시되는 용어의 명확한 사용은 소프트웨어를 실행할 능력을 가진 하드웨어를 배타적으로 인용하여 해석되어서는 아니되고, 제한 없이 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 롬(ROM), 램(RAM) 및 비 휘발성 메모리를 암시적으로 포함하는 것으로 이해되어야 한다. 주지관용의 다른 하드웨어도 포함될 수 있다.
본 명세서의 청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 청구범위에 의해 정의되는 본 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
본 발명에 의하면 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋(preset) 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하고, 생성된 복수의 오디오 프리셋 중 어느 하나를 선택하여 오디오 프리셋을 소비한다.
객체기반 오디오 서비스의 경우, 각 오디오 객체들의 위치 또는 음의 세기 등과 같은 특징들을 정의한 오디오 장면을 프리셋으로 정의할 수 있다. 프리셋 구성은 프리셋에 의한 오디오 장면 정보를 포함한다.
예를 들어, 보컬(vocal) 오디오 객체, 피아노 오디오 객체, 드럼 오디오 객체, 기타 오디오 객체, 키보드 오디오 객체 등 5개의 오디오 객체로 구성된 음악 콘텐츠에서, 제1 오디오 프리셋은 5개 오디오 객체 모두를 포함하는 구성을 프리셋 구성으로 하고, 제2 오디오 프리셋은 보컬 오디오 객체를 제외한 4개의 오디오 객체를 포함하는 구성을 프리셋 구성으로 하고, 제3 오디오 프리셋은 기타 오디오 객체를 제외한 4개의 오디오 객체를 포함하는 구성을 프리셋 구성으로 할 수 있다. 이 경우, 총 3개의 오디오 프리셋에 대해 설명하였으나, 더 많은 조합이 가능함은 자명하다. 또한, 5개의 오디오 객체를 모두 포함하는 프리셋 구성이라고 하더라도, 각 오디오 객체의 위치 또는 음의 세기를 조절함으로써 더 많은 오디오 프리셋을 생성할 수 있음도 자명하다.
각각의 프리셋 구성에 따라 오디오 객체를 믹싱하여 복수의 오디오 프리셋을 생성한 후, 이들을 저장하고 사용자 단말에 제공하면, 사용자 단말에서는 복수의 오디오 프리셋(전술한 예에서는 3개의 오디오 프리셋) 중 어느 하나의 오디오 프리셋을 선택할 수 있고, 선택된 오디오 프리셋만을 복호화하면 되기 때문에 적은 자원만으로도 사용자가 원하는 오디오 장면을 청취할 수 있다. 특히, 성능 제약이 많은 휴대 단말 기기에도 객체기반 오디오 서비스를 효과적으로 제공할 수 있다.
이하에서 본 발명에 따른 다양한 실시예를 도면을 참조하여 자세히 설명하도록 한다.
<오디오 프리셋 생성>
본 발명에 따른 오디오 프리셋 생성 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 포함한다.
프리셋 구성의 환경이라 함은 프리셋 구성을 설정할 수 있는 환경을 포함한다. 제공된 프리셋 구성의 환경에 의해 콘텐츠의 편집자는 프리셋 구성을 설정할 수 있다. 예를 들어, 편집자에게 복수의 오디오 객체들에 대한 리스트 정보에 기초하여 각 오디오 객체를 오디오 장면에 포함시킬 것인지 여부 또는 오디오 장면에서 각 오디오 객체의 위치 또는 음의 세기 등을 설정할 수 있는 환경을 제공하는 것이다.
또는, 사용자의 취향 또는 선호도 정보를 미리 수집하고, 이를 이용하여 사용자가 선호하는 프리셋 구성을 설정할 수도 있다. 예를 들어, 프리셋 구성의 환경을 제공하는 것은 사용자의 취향 또는 선호도 정보를 수집하여 프리셋 구성을 위해 제공하고, 사용자의 취향 또는 선호도 정보에 따라 프리셋 구성을 설정하는 것이다.
프리셋 구성이 설정되면, 설정된 프리셋 구성에 따라 복수의 오디오 객체들 을 믹싱하여 복수의 오디오 프리셋을 생성하고, 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성한다. 여기서 구성 정보는 하나의 오디오 콘텐츠에 대해 몇 개의 오디오 프리셋이 생성되어 있으며, 각 오디오 프리셋의 특징에 대한 정보를 제공하기 위한 것이다. 구성 정보는 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함할 수 있다. 여기서, 특징 정보는 사용자 단말의 사용자가 오디오 프리셋을 용이하게 선택할 수 있도록 하기 위한 것으로서, 각 오디오 프리셋에 대한 개략적인 정보를 포함할 수 있다. 예를 들어, 보컬이 빠진 오디오 프리셋인 경우에는 '카라오케'라는 정보를 제공할 수 있고, 원곡을 리믹스한 버전인 경우에는 '리믹스'라는 정보를 제공할 수 있다.
여기서, 복수의 오디오 프리셋과 구성 정보를 하나의 파일로 생성하는 단계를 더 포함할 수 있다. 복수의 오디오 프리셋과 구성 정보가 하나의 파일로 비트스트림에 포함되어 전송되는 경우, 구성 정보는 파일 헤더(header)에 포함될 수 있다.
하나의 파일에 포함된 복수의 오디오 프리셋은 순차적으로 저장될 수 있고, 또는 동일한 재생시간의 프레임 단위로 저장될 수 있다. 동일한 재생시간의 프레임 단위로 저장되는 경우에는, 사용자 단말에서 각 오디오 프리셋에 대한 엑세스가 용이하다. 예를 들어, 사용자 단말에서 제1 오디오 프리셋을 청취하는 도중, 해당 시점의 제2 오디오 프리셋을 청취하고자 하는 경우 제2 오디오 프리셋에 대한 엑세스가 용이하다.
도 1은 본 발명에 따른 오디오 프리셋 생성 장치를 설명하기 위한 도면이다. 도 1을 참조하면, 본 발명에 따른 오디오 프리셋 생성 장치(100)는 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 구성 환경 제공부(101), 프리셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 오디오 프리셋 생성부(103) 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 구성 정보 생성부(105)를 포함한다.
오디오 프리셋 생성 장치(100)는 복수의 오디오 객체(오디오 객체 #1, 오디오 객체 #2, ... , 오디오 객체 #N)를 입력받는다. 구성 환경 제공부(101)는 복수의 오디오 객체(오디오 객체 #1, 오디오 객체 #2, ... , 오디오 객체 #N)에 대한 프리셋 구성을 설정하는 환경을 제공한다. 오디오 프리셋 생성부(103)는 설정된 프리셋에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성한다. 오디오 프리셋 생성부(103)는 생성된 복수의 오디오 프리셋을 각각 부호화할 수 있다. 구성 정보 생성부(105)는 복수의 오디오 프리셋에 대한 구성 정보를 생성한다. 구성 정보는 구성 환경 제공부(101)에 의해 설정된 프리셋 구성을 이용할 수 있다. 구성 정보는 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함할 수 있다.
본 발명에 따른 오디오 프리셋 생성 장치는 복수의 오디오 프리셋과 구성 정보를 하나의 파일로 생성하는 파일 생성부(107)을 더 포함할 수 있다. 생성된 파일은 비트스트림을 통해 사용자 단말에 전송될 수 있다.
파일에 저장되는 복수의 오디오 프리셋은 동일한 재생시간의 프레임 단위로 저장될 수 있다.
본 발명에 따른 오디오 프리셋 생성 장치에 대한 상세한 설명은 전술한 오디오 프리셋 생성 방법과 중복되는 부분이 있으므로, 여기서는 생략하기로 한다.
<오디오 프리셋 소비>
본 발명에 따른 오디오 프리셋 소비 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계, 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계 및 선택된 오디오 프리셋을 복호화하는 단계를 포함한다.
비트스트림에는 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함한다. 복수의 오디오 프리셋은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 것으로서, 복수의 오디오 객체들이 기 설정된 프리셋 구성에 따라 생성된 오디오 장면이다. 구성 정보는 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함할 수 있다.
선택을 위한 환경을 제공하는 것은 구성 정보에 따라 수신된 오디오 프리셋은 몇 개이고, 각 오디오 프리셋은 어떠한 특징을 가지고 있는 지에 대한 정보를 사용자에게 제공하는 것을 포함할 수 있다. 이렇게 함으로써, 사용자는 수신된 복수의 오디오 프리셋 중에서 선호하는 오디오 프리셋을 선택할 수 있다.
한편, 복수의 오디오 프리셋과 구성 정보는 하나의 파일에 포함되어 비트스트림으로 수신될 수 있다. 또한, 복수의 오디오 프리셋은 파일에 동일한 재생시간 의 프레임 단위로 저장될 수 있다.
본 발명에 따른 오디오 프리셋 소비 방법에 대한 설명에 있어서,전술한 오디오 프리셋 생성에 대한 부분과 중복되는 부분은 여기서는 생략하기로 한다.
도 2는 본 발명에 따른 사용자 단말을 설명하기 위한 도면이다. 도 2를 참조하면, 본 발명에 따른 사용자 단말(200)은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 수신부(201), 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 선택 환경 제공부(203) 및 선택된 오디오 프리셋을 복호화하는 복호화부(205)를 포함한다. 복호화부(205)는 하나의 선택된 오디오 프리셋만을 복호화하면 되기 때문에, 본 발명에 따른 사용자 단말은 적은 자원을 이용하여 객체기반 오디오 서비스를 제공받을 수 있다. 구성 정보는 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함할 수 있다.
한편, 복수의 오디오 프리셋과 구성 정보는 하나의 파일에 포함될 수 있다. 또한, 복수의 오디오 프리셋은 파일에 동일한 재생시간의 프레임 단위로 저장될 수 있다.
본 발명에 따른 사용자 단말에 대한 설명에 있어서, 전술한 오디오 프리셋 소비 방법의 설명과 중복되는 부분은 여기서는 생략하기로 한다.
<컴퓨터로 읽을 수 있는 기록매체>
본 발명에 따른 오디오 프리셋 생성을 위한 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터로 읽을 수 있는 기록매체에 있어서, 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성을 위한 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 수행하는 프로그램을 포함한다.
본 발명에 따른 오디오 프리셋 생성을 위한 컴퓨터로 읽을 수 있는 기록매체에 대한 구체적인 설명은 전술한 오디오 프리셋 생성부분에서 설명하였으므로, 여기서는 생략하기로 한다.
본 발명에 따른 오디오 프리셋 소비를 위한 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터로 읽을 수 있는 기록매체에 있어서, 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계, 구성 정보에 따라 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계 및 선택된 오디오 프리셋을 복호화하는 단계를 수행하는 프로그램을 포함한다.
본 발명에 따른 오디오 프리셋 소비를 위한 컴퓨터로 읽을 수 있는 기록매체에 대한 구체적인 설명은 전술한 오디오 프리셋 소비부분에서 설명하였으므로, 여기서는 생략하기로 한다.
<파일 구조>
도 3과 4는 본 발명에 따른 파일 구조를 설명하기 위한 도면이다. 도 3을 참조하면, 본 발명에 따른 파일 구조(300)는 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋(303, 305, ..., 306) 및 복수의 오디오 프리셋에 대한 구성 정보(301)가 하나의 파일(300)에 포함되고, 구성 정보(301)에 기초하여 복수의 오디오 프리셋(303, 305, ..., 306) 중 어느 하나의 선택을 가능하도록 하는 파일 구조이다. 구성 정보(301)는 복수의 오디오 프리셋(303, 305, ..., 306)의 개수 정보(프리셋 개수 정보) 및 각 오디오 프리셋의 특징 정보(프리셋1, 프리셋2, ..., 프리셋 n)를 포함할 수 있다. 구성 정보(301)는 파일 헤더에 포함될 수 있다. 도 3에서는 복수의 오디오 프리셋((303, 305, ..., 306)이 파일(300)에 순차적으로 저장된 것이 도시되었다.
도 4는 본 발명에 따른 파일 구조의 다른 실시예를 설명하기 위한 도면이다. 도 4를 참조하면, 복수의 오디오 프리셋이 동일한 재생시간의 프레임 단위(403, 405, ..., 407)로 파일(400)에 저장된 것을 확인할 수 있다. 이렇게 동일한 재생시간의 프레임 단위로 저장됨으로써, 오디오 프리셋에 대한 엑세스가 더 용이해질 수 있다. 구성 정보(401)는 도 3의 설명과 동일하므로 여기서는 생략하기로 한다.
본 발명에 따른 파일 구조에 대한 상세한 설명에 있어서, 전술한 오디오 프리셋의 생성과 소비에 대한 설명과 중복되는 부분에 대해서는 생략하기로 한다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
본 발명은 객체기반 오디오 서비스의 제공과 소비에 사용된다.
도 1은 본 발명에 따른 오디오 프리셋 생성 장치를 설명하기 위한 도면이다.
도 2는 본 발명에 따른 사용자 단말을 설명하기 위한 도면이다.
도 3은 본 발명에 따른 파일 구조를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 파일 구조의 다른 실시예를 설명하기 위한 도면이다.

Claims (18)

  1. 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 단계;
    상기 프레셋 구성에 따라 상기 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계; 및
    상기 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 포함하는, 오디오 프리셋 생성 방법.
  2. 제1항에 있어서,
    상기 복수의 오디오 프리셋과 상기 구성 정보를 하나의 파일로 생성하는 단계를 더 포함하는, 오디오 프리셋 생성 방법.
  3. 제2항에 있어서,
    상기 복수의 오디오 프리셋은 상기 파일에 동일한 재생시간의 프레임 단위로 저장되는, 오디오 프리셋 생성 방법.
  4. 제1항에 있어서,
    상기 구성 정보는
    상기 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함하는, 오디오 프리셋 생성 방법.
  5. 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 구성 환경 제공부;
    상기 프리셋 구성에 따라 상기 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 오디오 프리셋 생성부; 및
    상기 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 구성 정보 생성부를 포함하는, 오디오 프리셋 생성 장치.
  6. 제5항에 있어서,
    상기 복수의 오디오 프리셋과 상기 구성 정보를 하나의 파일로 생성하는 파일 생성부를 더 포함하는, 오디오 프리셋 생성 장치.
  7. 제6항에 있어서,
    상기 복수의 오디오 프리셋은 상기 파일에 동일한 재생시간의 프레임 단위로 저장되는, 오디오 프리셋 생성 장치.
  8. 제5항에 있어서,
    상기 구성 정보는
    상기 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함하는, 오디오 프리셋 생성 장치.
  9. 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 상기 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계;
    상기 구성 정보에 따라 상기 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계; 및
    상기 선택된 오디오 프리셋을 복호화하는 단계를 포함하는, 오디오 프리셋 소비 방법.
  10. 제9항에 있어서,
    상기 복수의 오디오 프리셋과 상기 구성 정보는 하나의 파일에 포함된, 오디오 프리셋 소비 방법.
  11. 제10항에 있어서,
    상기 복수의 오디오 프리셋은 상기 파일에 동일한 재생시간의 프레임 단위로 저장되는, 오디오 프리셋 소비 방법.
  12. 제9항에 있어서,
    상기 구성 정보는
    상기 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함하는, 오디오 프리셋 소비 방법.
  13. 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 상기 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 수신부;
    상기 구성 정보에 따라 상기 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 선택 환경 제공부; 및
    상기 선택된 오디오 프리셋을 복호화하는 복호화부를 포함하는, 사용자 단말.
  14. 제13항에 있어서,
    상기 복수의 오디오 프리셋과 상기 구성 정보는 하나의 파일에 포함된, 사용자 단말.
  15. 제14항에 있어서,
    상기 복수의 오디오 프리셋은 상기 파일에 동일한 재생시간의 프레임 단위로 저장되는, 사용자 단말.
  16. 제13항에 있어서,
    상기 구성 정보는
    상기 복수의 오디오 프리셋의 개수 정보 및 각 오디오 프리셋의 특징 정보를 포함하는, 사용자 단말.
  17. 컴퓨터로 읽을 수 있는 기록매체에 있어서,
    복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성을 위한 환경을 제공하는 단계;
    상기 프레셋 구성에 따라 상기 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계; 및
    상기 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 수행하는 프로그램을 포함하는, 오디오 프리셋 생성을 위한 컴퓨터로 읽을 수 있는 기록매체.
  18. 컴퓨터로 읽을 수 있는 기록매체에 있어서,
    복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성에 따라 믹싱된 복수의 오디오 프리셋과 상기 복수의 오디오 프리셋에 대한 구성 정보를 포함하는 비트스트림을 수신하는 단계;
    상기 구성 정보에 따라 상기 복수의 오디오 프리셋 중 어느 하나의 선택을 위한 환경을 제공하는 단계; 및
    상기 선택된 오디오 프리셋을 복호화하는 단계를 수행하는 프로그램을 포함하는, 오디오 프리셋 소비를 위한 컴퓨터로 읽을 수 있는 기록매체.
KR1020080104938A 2007-11-07 2008-10-24 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조 KR100999702B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070113372 2007-11-07
KR20070113372 2007-11-07

Publications (2)

Publication Number Publication Date
KR20090047355A true KR20090047355A (ko) 2009-05-12
KR100999702B1 KR100999702B1 (ko) 2010-12-08

Family

ID=40856850

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080104938A KR100999702B1 (ko) 2007-11-07 2008-10-24 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조

Country Status (1)

Country Link
KR (1) KR100999702B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8976983B2 (en) 2008-04-23 2015-03-10 Electronics And Telecommunications Research Institute Method for generating and playing object-based audio contents and computer readable recording medium for recoding data having file format structure for object-based audio service

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110069934A1 (en) * 2009-09-24 2011-03-24 Electronics And Telecommunications Research Institute Apparatus and method for providing object based audio file, and apparatus and method for playing back object based audio file

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8976983B2 (en) 2008-04-23 2015-03-10 Electronics And Telecommunications Research Institute Method for generating and playing object-based audio contents and computer readable recording medium for recoding data having file format structure for object-based audio service

Also Published As

Publication number Publication date
KR100999702B1 (ko) 2010-12-08

Similar Documents

Publication Publication Date Title
US11501789B2 (en) Encoded audio metadata-based equalization
US10750284B2 (en) Techniques for presenting sound effects on a portable media player
KR101849612B1 (ko) 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치
KR100868475B1 (ko) 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성방법
KR101100221B1 (ko) 오디오 신호의 디코딩 방법 및 그 장치
JP5535317B2 (ja) バッファされた音声データと生放送との同期
RU2689438C2 (ru) Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа
Bleidt et al. Development of the MPEG-H TV audio system for ATSC 3.0
US20110066438A1 (en) Contextual voiceover
KR101227932B1 (ko) 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
US20090306985A1 (en) System and method for synthetically generated speech describing media content
JP2010521013A (ja) オーディオ信号の処理方法及び装置
CN103915086A (zh) 信息处理的方法、装置和系统
CN109417648B (zh) 接收装置及接收方法
US10657978B2 (en) Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method
KR100999702B1 (ko) 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조
CN104038772B (zh) 生成铃声文件的方法及装置
US8751024B2 (en) Method and apparatus for generation and playback of object based audio contents
JP2009244912A (ja) 音声信号処理装置及び音声信号処理方法
JP4219881B2 (ja) 再生装置
KR101193152B1 (ko) 객체 기반 음원간 객체 정합 방법 및 장치
JP6559542B2 (ja) 受信装置、受信方法およびプログラム
JP2008145650A (ja) 再生制限付き音楽コンテンツの配信システム及び配信方法並びに携帯端末
KR101125364B1 (ko) 객체기반 오디오 파일 제공 장치 및 객체기반 오디오 파일 재생 장치, 그리고, 객체기반 오디오 파일 제공 방법 및 객체기반 오디오 재생 방법
KR20100125118A (ko) 오디오 생성방법, 오디오 생성장치, 오디오 재생방법 및 오디오 재생장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161121

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181025

Year of fee payment: 9