JP5840560B2 - オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法 - Google Patents

オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法 Download PDF

Info

Publication number
JP5840560B2
JP5840560B2 JP2012097550A JP2012097550A JP5840560B2 JP 5840560 B2 JP5840560 B2 JP 5840560B2 JP 2012097550 A JP2012097550 A JP 2012097550A JP 2012097550 A JP2012097550 A JP 2012097550A JP 5840560 B2 JP5840560 B2 JP 5840560B2
Authority
JP
Japan
Prior art keywords
preset
content file
audio content
audio
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012097550A
Other languages
English (en)
Other versions
JP2012168552A (ja
Inventor
ジャン、イン‐ソン
リー、テ‐ジン
リー、ヨン‐ジュ
ヨー、ジェ‐ヒュン
ジャン、テ‐ヤン
ホン、ジン‐ウー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2012168552A publication Critical patent/JP2012168552A/ja
Application granted granted Critical
Publication of JP5840560B2 publication Critical patent/JP5840560B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27BFURNACES, KILNS, OVENS, OR RETORTS IN GENERAL; OPEN SINTERING OR LIKE APPARATUS
    • F27B17/00Furnaces of a kind not covered by any preceding group
    • F27B17/0016Chamber type furnaces
    • F27B17/0083Chamber type furnaces with means for circulating the atmosphere
    • CCHEMISTRY; METALLURGY
    • C25ELECTROLYTIC OR ELECTROPHORETIC PROCESSES; APPARATUS THEREFOR
    • C25DPROCESSES FOR THE ELECTROLYTIC OR ELECTROPHORETIC PRODUCTION OF COATINGS; ELECTROFORMING; APPARATUS THEREFOR
    • C25D5/00Electroplating characterised by the process; Pretreatment or after-treatment of workpieces
    • C25D5/48After-treatment of electroplated surfaces
    • C25D5/50After-treatment of electroplated surfaces by heat-treatment
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27DDETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
    • F27D7/00Forming, maintaining, or circulating atmospheres in heating chambers
    • F27D7/02Supplying steam, vapour, gases, or liquids
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27DDETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
    • F27D7/00Forming, maintaining, or circulating atmospheres in heating chambers
    • F27D7/04Circulating atmospheres by mechanical means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27DDETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
    • F27D7/00Forming, maintaining, or circulating atmospheres in heating chambers
    • F27D7/02Supplying steam, vapour, gases, or liquids
    • F27D2007/023Conduits
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27DDETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
    • F27D99/00Subject matter not provided for in other groups of this subclass
    • F27D99/0001Heating elements or systems
    • F27D99/0006Electric heating elements or system
    • F27D2099/0026Electric heating elements or system with a generator of electromagnetic radiations
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F27FURNACES; KILNS; OVENS; RETORTS
    • F27DDETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
    • F27D99/00Subject matter not provided for in other groups of this subclass
    • F27D99/0001Heating elements or systems
    • F27D2099/0061Indirect heating
    • F27D2099/0065Gas

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Materials Engineering (AREA)
  • Metallurgy (AREA)
  • Organic Chemistry (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法に関し、より詳細には、オブジェクト基盤オーディオサービスの機能を増大させてオーディオコンテンツファイルの各オブジェクトへのアクセスの容易性を増加させるための、オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法に関する。
TV放送、ラジオ放送、DMBなどのような放送サービスを介して提供されるオーディオ信号は、様々な音源から取得されたオーディオ信号が合成されて1つのオーディオ信号として格納/送信されるものである。
このような環境では、視聴者が全体オーディオ信号の強度などを調節することは可能であるが、オーディオ信号内に含まれた各音源別にオーディオ信号の強度を調節するなどのような、音源別のオーディオ信号の特性制御は不可能である。
しかしながら、オーディオコンテンツを著作するときに、各音源別にオーディオ信号を合成せずに独立的に格納するとすれば、コンテンツ再生端末では各音源別のオーディオ信号に対する強度などを制御しながら該当のコンテンツを視聴できるようになる。このように、格納/送信端で複数のオーディオ信号を独立的に格納/送信し、視聴者が受信機(コンテンツ再生端末)でそれぞれのオーディオ信号を適切に制御しながら聴取できるようにするオーディオサービスを「オブジェクト基盤オーディオサービス」と言う。
このようなオブジェクト基盤オーディオコンテンツには、既存のMP3、AAC(Advanced Audio Coding)などの音楽ファイルとは異なり、複数のオーディオオブジェクトが含まれている。MPEG−4システム規格(ISO/IEC14496−1)では、複数のオブジェクトを含むコンテンツのファイル構造に対して定義しており、オブジェクト基盤オーディオコンテンツの格納に活用することができる。
一般的なマルチメディアサービスの場合、1つのオーディオオブジェクトと1つのビデオオブジェクトでサービスがなされる場合が大部分であるが、MPEG−4システム規格では、複数のオブジェクトを含むマルチメディアサービスに対して定義している。オブジェクト基盤オーディオサービスの場合にも、MPEG−4システムの定義と類似するように、複数のオブジェクトを含むマルチメディアコンテンツサービスであると言える。
しかしながら、MPEG−4システム規格では、オーディオ、ビデオ、静止画などの多様な形態のメディアをすべて含む形態のファイル構造を定義していることに比べ、オブジェクト基盤オーディオコンテンツの場合には、同種類の多数のオブジェクトを含む特徴があり、既存のMPEG−4システムで定義しているファイル構造よりも効率的にコンテンツを格納して各オブジェクトに対するアクセスの容易性を高めることができる可能性がある。
一方、MPEG−4システム規格(ISO/IEC14496−1)では、複数のオブジェクトを含むコンテンツのファイル構造に対して定義しているが、このようなMPEG−4システム規格によるファイルフォーマットには、オブジェクトの3次元場面情報である「BIFS」とオブジェクトに対する情報である「OD」、およびそれぞれのオブジェクトのストリームにアクセスすることができる「索引情報」が含まれ、BIFS、ODなどと各オブジェクトストリームデータが含まれる。ここで、各オブジェクトデータは、ファイル内部に存在することもできるし、他のファイルとして存在することもできる。このとき、それぞれのオブジェクトストリームに対する「索引情報」は、各オブジェクト別に区分されて生成されて格納され、それぞれのオブジェクトストリームもストリーム別に区分されて格納される。
上述したような従来のMPEG−4システム規格によるオブジェクト基盤オーディオコンテンツサービスを「オブジェクトへのアクセスの容易性」側面において詳察すれば、多数のオブジェクトを格納する場合、オブジェクト別にフレームを格納したり全体オブジェクトデータを順に格納する方式を採用していたため、オブジェクトへのアクセス性が著しく低下するという問題点があった。
また、上述したような従来のオブジェクト基盤オーディオコンテンツサービスでは、コンテンツファイルの各オブジェクトに対するアクセスの容易性のために(すなわち、ランダムアクセス(Random Access)を容易にするために)、各フレームの位置情報、大きさ情報などを「索引(index)情報」として用いる。しかしながら、このような従来の索引情報生成方法は、各メディアの最小再生単位(オーディオの場合はフレーム単位)を基盤として生成するため、すなわち、フレーム別に索引情報を生成しなければならないため、生成される索引情報量が大きく、索引情報を求める演算量も多く、これによってランダムアクセス速度が遅くなるという問題点があった。
一方、MPEG−4システムでは、BIFSデータおよびBIFSコマンド(command)を用いてユーザインタラクションを介した3次元場面情報を変更することができるが、著作段階ではこのような変更された3次元場面情報を考慮してBIFSデータを適切に生成しなければならず、コンテンツ再生端末ではBIFSコマンドを解釈できなければならない。このように、MPEG−4システムでは、多様なユーザインタラクションのための機能を含んでいるが、このような機能のためには、著作段階やコンテンツ再生端末で多少複雑な動作の実行が求められる特徴がある。
しかしながら、オブジェクト基盤オーディオサービスでは、ユーザが各オーディオオブジェクトの位置、音の大きさなどを制御すれば、新たな3次元オーディオ場面情報(プリセット)を容易に生成することができるであろう。
このように、ユーザによってオーディオプリセットを自由に生成できるようにしたり、またはオブジェクト基盤オーディオコンテンツファイルのオブジェクトに対してオブジェクト追加/削除/変更が可能なようにすれば、ユーザインタラクションを機能を介してオブジェクト基盤オーディオサービスの機能を増大させることができるであろう。
すなわち、オブジェクト基盤オーディオコンテンツサービスの提供において、オブジェクト基盤オーディオサービスの機能を増大させ、各オブジェクトに対するアクセスの容易性を高めることができる効率的なコンテンツファイル構造が切に求められている。
本発明は、上述したような要求に応じるために提案されたものであって、オブジェクト基盤オーディオサービスの機能を増大させてオーディオコンテンツファイルの各オブジェクトへのアクセスの容易性を増加させるための、オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法を提供することを目的とする。
本発明の他の目的および長所は、下記の説明によって理解することができ、本発明の実施形態によってより明確に理解できるであろう。また、本発明の目的および長所は、特許請求の範囲に示した手段およびその組み合わせによって実現できることを容易に理解できるであろう。
上述した目的を達成するために、本発明は、オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイル生成方法において、オーディオコンテンツを構成するそれぞれのオブジェクトに対して複数のフレームを生成するフレーム化ステップと、前記生成されたフレームを再生時刻を基準としてグループ化して格納することによって多重オブジェクトオーディオコンテンツファイルを生成するコンテンツファイル生成ステップとを含む。また、前記本発明は、フレームグループ別に索引情報を生成して前記多重オブジェクトオーディオコンテンツファイルのヘッダに格納する索引情報生成ステップと、前記オーディオコンテンツのオブジェクトを用いてオーディオプリセットを生成するプリセット生成ステップと、前記生成されたオーディオプリセットに対する個数およびプリセット名を含むプリセット関連情報を生成するステップとをさらに含む。
また、本発明は、オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイル生成方法において、オーディオコンテンツを構成するそれぞれのオブジェクトに対して複数のフレームを生成するフレーム化ステップと、前記生成されたフレームをオブジェクト別に格納して多重オブジェクトオーディオコンテンツファイルを生成するが、同じ再生時刻を有するフレームに対する位置情報を索引情報として前記多重オブジェクトオーディオコンテンツファイルのヘッダに格納するコンテンツファイル生成ステップとを含む。また、前記本発明は、前記オーディオコンテンツのオブジェクトを用いてオーディオプリセットを生成するプリセット生成ステップと、前記生成されたオーディオプリセットに対する個数およびプリセット名を含むプリセット関連情報を生成するステップをさらに含む。
また、本発明は、多重オブジェクトオーディオコンテンツファイルに対するオーディオプリセット生成方法において、編集者またはユーザから前記多重オブジェクトオーディオコンテンツファイルに対するオーディオオブジェクトのうちでオーディオプリセットの生成に必要なオーディオオブジェクトが選択されるオブジェクト選択ステップと、前記編集者または前記ユーザから前記選択されたそれぞれのオーディオオブジェクトに対するプリセット設定情報が入力される設定情報入力ステップと、前記プリセット設定情報によって該当のオーディオオブジェクトを設定してオーディオプリセットを生成するプリセット生成ステップとを含む。前記本発明は、前記生成されたオーディオプリセットに対する全体個数およびプリセット名を含むプリセット関連情報を生成するステップをさらに含む。
また、本発明は、多重オブジェクトオーディオコンテンツファイルの編集方法において、多重オブジェクトオーディオコンテンツファイルに対するオブジェクト情報およびプリセット情報をユーザに提供するステップと、前記ユーザの要求に応じて前記多重オブジェクトオーディオコンテンツファイルに対するオブジェクトまたはプリセットを変更するステップとを含む。
また、本発明は、多重オブジェクトオーディオコンテンツファイルの再生方法において、多重オブジェクトオーディオコンテンツファイルを分析するステップと、分析結果から前記多重オブジェクトオーディオコンテンツファイルのオブジェクトフレームの位置に対する索引情報を取得するステップと、前記索引情報を用いて再生時刻が同じであるオブジェクトフレームを検索して前記多重オブジェクトオーディオコンテンツファイルを再生するステップとを含む。また、前記本発明は、前記多重オブジェクトオーディオコンテンツに対するオーディオプリセットの種類を出力するステップと、ユーザから選択されたオーディオプリセットの設定情報を用いて該当のオーディオ場面を構成するステップとをさらに含む。
まず、本発明について簡略に説明すれば次のとおりとなる。本発明では、複数のプリセットオーディオ場面情報をオーディオコンテンツファイルの内部に格納することにより、オブジェクト基盤オーディオサービスのユーザ選択機能を可能とし、さらにユーザが定義したプリセットオーディオ場面情報をオブジェクト基盤オーディオコンテンツファイル内部に格納できるようにして、ユーザが新たなオーディオ場面を生成することを可能にする。このとき、ユーザが新たなオーディオ場面を生成し、独立的なファイルで格納することも可能である。
また、本発明は、オブジェクト基盤オーディオコンテンツのオブジェクトアクセスの容易性のために、オブジェクト別にフレームを格納するのではなく、同じ再生時刻またはデコーディング時刻を有するオブジェクトのフレームをグループで束ねてファイルに格納する。すなわち、複数のオブジェクトをファイルで格納するとき、全体のオブジェクトデータを順に格納するのではなく、同じ再生時刻を有するフレームを束ねて格納する方式を用いる。
また、本発明は、ファイルにおける各オブジェクトに対するアクセスの容易性のために、索引情報をフレーム別に格納せずに、任意のフレーム単位または時間単位で格納して用いる。
さらに、本発明は、多数のプリセット情報(プリセットおよびプリセット関連情報)を生成してオーディオコンテンツファイル内部に格納したり、または別途の独立したファイルに格納する。このように独立したファイルで格納されたプリセット情報は、以後、ユーザ側の処理を介して該当のオーディオコンテンツファイル内部に格納されることができる。
上述したような本発明は、オブジェクト基盤オーディオコンテンツを効率的に格納して送信することにより、オブジェクト基盤オーディオサービスの提供時に帯域幅を節減させる効果がある。
また、本発明は、オブジェクト別にフレームを格納せずに、同じ再生時刻を有するオブジェクトのフレームをグループで束ねて該当のオーディオコンテンツファイルに格納し、また索引情報もフレーム別に格納せずに任意のフレーム単位または時間単位で索引情報を格納することにより、オブジェクト基盤オーディオコンテンツのオブジェクトへのアクセスを容易にする効果がある。
また、本発明は、オブジェクト基盤オーディオコンテンツを格納するとき、オブジェクト基盤オーディオサービスの機能を増大させ、各オブジェクトに対するアクセスの容易性を高めることができる効率的なオーディオコンテンツファイルの構造を提供することにより、一般的なファイル構造よりも効率的にオブジェクト基盤オーディオサービスを再生できるようにする効果がある。
また、本発明は、各オブジェクトの位置、音の強度などのような特徴に基づいて設定されたプリセット(Preset)を多重オブジェクトオーディオコンテンツファイル内部に格納したり、または別途の独立したファイルで格納してユーザに提供することにより、オブジェクト基盤オーディオサービスをより効率的に再生できるようにする効果がある。
さらに、本発明は、デジタル放送、ラジオ放送、DMB、インターネット放送、デジタル映画、DVD、動画コンテンツ、レコードなどのようにオブジェクト基盤オーディオサービスが提供されるすべての放送サービスおよびマルチメディアサービスに適用され、効率的にオブジェクト基盤オーディオコンテンツを送信、格納、および再生できるようにする効果がある。
従来のMPEG−4システム規格による複数のオブジェクトを含むオーディオコンテンツファイルを示す構成図である。 本発明に係るオブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図である。 本発明に係る編集者プリセット情報を含む多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図である。 本発明に係るユーザプリセット情報を含む多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図である。 本発明に係るオブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイル生成方法に対する一実施形態を示すフローチャートである。 本発明に係るオブジェクト基盤オーディオサービスのためのオーディオプリセット生成方法に対する一実施形態を示すフローチャートである。 本発明に係る編集者側のオーディオエンコーディング装置の画面構成図である。 本発明に係るユーザのコンテンツ再生端末の画面構成図である。 本発明に係る多重オブジェクトオーディオコンテンツファイルの編集方法に対する一実施形態を示すフローチャートである。 本発明に係る多重オブジェクトオーディオコンテンツファイルの再生方法に対する一実施形態を示すフローチャートである。
上述した目的、特徴、および長所は、添付の図面と関連した後述する詳細な説明を介してより明確になるはずであり、これによって本発明が属する技術分野において通常の知識を有する者によって、本発明の技術的思想を容易に実施することができるであろう。さらに、本発明の説明において、本発明と関連した公知技術に対する具体的な説明が本発明の要旨を不必要に不明確にし得ると判断される場合には、その詳細な説明は省略する。以下、添付の図面を参照しながら、本発明に係る好ましい一実施形態について詳しく説明する。
図1は、MPEG−4システム規格による複数のオブジェクトを含むオーディオコンテンツファイルを示す構成図であり、図2は、本発明に係るオブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図である。
本発明と関連するオブジェクト基盤オーディオサービスの場合も、複数のオブジェクトを含むコンテンツに関するものであるため、基本的にはMPEG−4システムで定義しているコンテンツファイル構造に従うことが可能である。
しかしながら、オブジェクト基盤オーディオサービスの場合は、必要に応じては1つ程度のビデオオブジェクトを含むこともあるが、大部分はオーディオオブジェクトのみを含み、各オーディオオブジェクトは同じ符号化方式を用い、同じフレーム大きさ(1フレームがデコーディングされて再生される時間)と同じフレーム率を有し、同じ再生時刻情報を有することが一般的である。このようなオブジェクト基盤オーディオコンテンツの特徴は、MPEG−4システム規格で定義しているファイル構造よりも一層効率的なファイル構造を有することを可能にする。
MPEG−4システム規格による多重オブジェクトオーディオコンテンツファイル10は、「ヘッダ」11と「オブジェクトデータ」12〜14で構成されることができ、このうち「オブジェクトデータ」が、図1に示すように各オブジェクト別12〜14に複数のフレームで格納されている場合には、同じ時間に再生されなければならないフレームを取得するために各オブジェクト別に該当のフレームを探さなければならないが、もしオブジェクトの数が多ければ、それだけファイル内部でオブジェクト別の該当のフレームを探さなければならない回数も多くなるという問題が生じるようになる。
しかしながら、本発明によって、図2に示すようなファイル(多重オブジェクトオーディオコンテンツファイル)20〜22の構造を有すれば、同じ再生時刻を有するフレームが一緒に集まっているため、たとえオブジェクトの数が多くても、1度の検索で同じ再生時刻を有するフレームを1度に探すことができるようになる。
したがって、本発明では、オブジェクト基盤オーディオサービスを提供するために多数のオブジェクトをファイルで格納するとき、図1に示すように全体オブジェクトデータを順に格納する方式を採用せずに、図2に示すように同じ「再生時刻」を有するフレームを束ねて格納する方式を用いる(すなわち、オーディオコンテンツを構成するそれぞれのオブジェクトに対する複数のフレームを、「再生時刻」を基準としてグループ化して格納することによってオーディオコンテンツファイルを生成する)22。
図3は、本発明に係る編集者プリセット情報を含む多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図であり、図4は、本発明に係るユーザプリセット情報を含む多重オブジェクトオーディオコンテンツファイルの一実施形態を示す構成図である。
MPEG−4システムでは、BIFSデータおよびBIFSコマンドを用いてユーザインタラクションを介した3次元場面情報を変更することができるが、このためには、著作段階で3次元場面情報変更を考慮してBIFSデータを適切に生成しなければならず、また、ユーザ端末(オーディオコンテンツ再生端末)でもBIFSコマンドを解釈できなければならない。このように、MPEG−4システムでは、多様なユーザインタラクションのための機能を含んでいるが、このような機能のためには、著作段階やコンテンツ再生端末で多少複雑な動作が求められる。
しかしながら、オブジェクト基盤オーディオサービスの場合には、サービス提供者側では各オブジェクトの位置、音の強度などのような特徴を定義した3次元オーディオ場面情報をプリセットとして定義して提供し、コンテンツ再生端末では、プリセットを制御する機能などのような比較的簡単な制御機能を含まなければならないが、このような機能は端末で容易に制御することができる機能であるため、MPEG−4システムのような多少複雑な構造を有さなくても端末で容易に実現することができる。
したがって、オブジェクト基盤オーディオコンテンツ提供者側では、複数のオーディオオブジェクトで構成された3次元オーディオ場面情報のみを提供し、これを制御することは純然に端末で実現するようにすることが効率的である。
このために、本発明では、オブジェクト基盤オーディオコンテンツに単純に複数の既に設定された3次元オーディオ場面情報を含む方法を用いる。このとき、既に著作された3次元オーディオ場面情報は、1次的にはコンテンツ著作者が生成するものである。
すなわち、本発明では、図3に示すように、ファイル(オブジェクト基盤オーディオコンテンツファイル)内部30(より正確には、ファイルヘッダ31)に、全体プリセットの個数、プリセット名などのようなプリセットと関連する情報(「プリセット関連情報」)311と、各オーディオオブジェクトの3次元空間上の位置、音の大きさ(信号レベル)、反響(Echo)情報などのようなオーディオオブジェクトの特性を含む「プリセット」312〜315を格納する。このようなプリセット情報(編集者プリセット情報)をオブジェクト基盤オーディオコンテンツファイルに格納して提供せずに、別途の独立したファイルで格納してユーザに提供することもできる。
図3に示すような構造を有するオーディオコンテンツファイルを受信して再生する端末(例えば、視聴者の受信機など)では、プリセット関連情報311と各プリセット312〜315から各オブジェクトのオーディオ特性を取得して適切にオブジェクトを制御して、3次元オーディオを再生できるようになる。
一方、オブジェクト基盤オーディオサービスでは、コンテンツ再生端末のユーザが各オーディオオブジェクトの位置、音の大きさ(信号レベル)などを制御することにより、新たな3次元オーディオ場面情報を生成することもできるが、これを格納すれば、図4に示すような「ユーザプリセット」(すなわち、オブジェクト基盤オーディオサービス提供者側の編集者の生成したプリセットではなく、ユーザが生成したプリセット)となる。
本発明では、オブジェクト基盤オーディオコンテンツファイル40内にユーザが著作したプリセット情報41を格納できるようにする構造を有する。したがって、オブジェクト基盤オーディオサービスが提供されたユーザは、提供されたオーディオコンテンツファイル40内に自身が著作した「ユーザプリセット情報」41を含む(格納する)ことができる。これとは異なり、ユーザ(ユーザ1)は、ユーザプリセット情報を該当のオーディオコンテンツファイルとは別途の独立的なファイルで格納して他のユーザ(ユーザ2)に提供することもできる。このように独立的なファイルで提供される「ユーザプリセット情報」41は、ユーザ2の後処理過程を介して事後的に該当のオブジェクト基盤オーディオコンテンツファイルに含まれることができる。
すなわち、本発明は、図4に示すように、多重オブジェクトオーディオコンテンツファイル40にユーザプリセット情報41を格納できるようにすることにより、ユーザがそれぞれのオーディオオブジェクトを制御して生成した3次元オーディオ場面を新たな1つのプリセットとして設定できるようにする。このとき、ユーザが定義したプリセット情報は、図4に示すようにファイル内部に格納されることもできるし、図に示してはいないが、独立したファイルで格納されることもできる。独立したファイルで格納されたユーザプリセット情報は、後処理過程を介して事後的に該当のファイルに含まれることもできるが、このような点は、図3の「編集者プリセット情報」の場合と同じである。
図5は、本発明に係るオブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイル生成方法に対する一実施形態を示すフローチャートであり、オブジェクト基盤オーディオサービスを提供するオーディオエンコーディング装置で実行される。
一般的なオーディオ圧縮アルゴリズムは、フレーム別に圧縮するため、データを格納するときはフレーム単位で格納されている。フレーム別に格納されている複数のオブジェクトオーディオ信号を有して多重オブジェクトオーディオコンテンツを生成するとき、各オブジェクトを順次に格納せずに、同じ再生時刻を有するオブジェクトのフレームはグループ化して格納することにより、インターネットを介した送信時に効率的な送信が可能となる。また、多重オブジェクトコンテンツファイル内で特定の再生時刻を有するフレームに対する情報を探して索引情報として格納しておけば、以後にコンテンツ再生端末における効率的な任意位置再生をなすことができるようになる。
オーディオエンコーディング装置は、オーディオコンテンツを構成する複数のオーディオオブジェクトの入力を受け(500)、それぞれのオブジェクトをフレーム化することによってそれぞれのオブジェクトに対して複数のフレームを生成する(502)。
その後、オーディオエンコーディング装置は、生成された多数のフレームを再生時刻を基準としてグループ化し(504)、フレームグループ別に該当の索引情報を生成する(506)。
次に、オーディオエンコーディング装置は、グループ化されたフレームはオブジェクトデータ(図2の22)として格納し、該当の索引情報はヘッダ21に格納されることにより、多重オブジェクトオーディオコンテンツファイル(図2参照)を生成する(508)。
以下、段階506の索引情報生成過程について詳しく説明すれば、次のとおりとなる。
一般的なメディアファイルでは、ファイルにおけるランダムアクセスを容易にするために、各フレームの位置情報、大きさ情報などを索引(index)情報として提供する方法を用いる。このとき、索引情報は、各メディアの最小再生単位(オーディオの場合はフレーム単位)を基盤として生成することが一般的である。
しかしながら、本発明では、このような索引情報をメディアの最小再生単位ではない複数の最小再生単位をグループ化した任意の単位で生成する方法を用いる。本発明に係る方法で索引情報を生成する場合、索引情報の大きさが一般的な場合よりも小さくなり、索引情報の大きさの調節も可能となり、さらにランダムアクセス速度を向上させることができ、ランダムアクセスのための演算量を減らすことができるようになる。
本発明に係る場合、直接的なメディアデータのアクセスは、グループ化した単位でのみなされることにより、直接的なアクセスに対する分解能(Resolution)は低下することがあるが、直接アクセスした後に再びメディアデータを追跡してフレーム単位でアクセスすることが可能であるため、実際の分解能は一般的なフレーム単位インデキシングと差がなくなる。特に、一般的に秒(second)単位程度のインデキシングが可能となるときにマルチメディアをランダムアクセスすれば、視聴には大きい問題点がないという点を勘案すれば、本発明の効果は極めて大きいと言える。
例えば、秒あたり約43個のフレームを有する1分の長さのオーディオオブジェクトがあるとし、1つの索引情報は8バイトであるとする。これを既存の一般的な索引方法によって索引をするようになれば、フレーム別に索引情報を生成しなければならないため、下記の数式1のように20,640バイトが所要される。
Figure 0005840560
一方、本発明の実施形態によって、フレームグループ別に索引情報を生成すれば、例えば、20個のフレームあたり1つの索引情報を生成するとすれば、下記の数式2のように約1,320バイトが所要される。1フレームごとに生成した索引情報を20個のフレームごとに生成するため、1/20程度のバイトの節約が可能となる。ここで、フレームグループ別に生成される索引情報には、該当のグループに属する1番目のフレームの位置情報が含まれる。また、このように生成された索引情報は、多重オブジェクトオーディオコンテンツファイルのヘッダに格納される。
Figure 0005840560
本発明によれば、直接的なアクセスに対する分解能は20倍に増えたが、これは約0.5秒に該当するものであるため、実際にメディアを任意でアクセスして再生するときにも視聴に影響を及ぼさない水準であると言える。
上述した例では、20個のフレームを1つにグループ化したが、コンテンツに応じてグループ化するフレームの個数を自由に調整することが可能である。したがって、コンテンツに応じて分解能を適切に制御すれば、直接的なアクセスによる分解能の問題も解決することができる。
一方、他の実施形態として、オーディオコンテンツを構成するそれぞれのオブジェクトに対して生成されたフレームを「オブジェクト別」に整列して格納することにより、多重オブジェクトオーディオコンテンツファイルを生成する場合には、「同じ再生時刻を有するフレームに対する個別的な位置情報」を索引情報として該当の多重オブジェクトオーディオコンテンツファイルのヘッダに格納することもできる。
図6は、本発明に係るオブジェクト基盤オーディオサービスのためのオーディオプリセット生成方法に対する一実施形態を示すフローチャートである。
オーディオエンコーディング装置は、多重オブジェクトオーディオコンテンツの構成に用いられる複数のオーディオオブジェクト(オブジェクト信号)の入力を受け(600)、編集者に提供する。
この後、編集者は、多重オブジェクトオーディオコンテンツの構成に用いられるオブジェクトを選択するようになる。すなわち、オーディオエンコーディング装置は、編集者からオーディオプリセットの生成に必要なオーディオオブジェクトの選択を受けるようになる(602)。
次に、オーディオエンコーディング装置は、編集者から選択されたそれぞれのオーディオオブジェクトに対するプリセット設定情報(例えば、3次元プリセットを生成する場合には、それぞれのオブジェクト信号のレベルおよび3次元空想における位置情報が該当し、2次元プリセットを生成する場合には、それぞれのオブジェクト信号のレベル情報が該当する)の入力を受ける(604)。
この後、オーディオエンコーディング装置は、編集者から入力された設定情報によって該当のオーディオオブジェクトの信号レベルまたは3次元空間上の位置を設定してオーディオプリセットを生成する(606)。
このような過程を介して生成されたオーディオプリセットに対する全体個数およびプリセット名(Preset name)を含む「プリセット関連情報」を生成する(608)。
すなわち、編集者は、それぞれのオブジェクト信号の大きさと位置情報などを相違させながら複数のプリセット情報を生成した後、これに対する情報を多重オブジェクトオーディオコンテンツファイルのビットストリームに格納してユーザに提供することにより、ユーザがこのうちのいずれか1つを自身の趣向によって選択できるようにする。
図6によるプリセット生成過程を具体的に説明すれば、次のとおりとなる。すなわち、歌手の声(ボーカル)、その他、ピアノ、ドラム、キーボードなどのオーディオオブジェクトを用いて複数のプリセットを生成する場合について説明する。
□プリセット1(ボーカルモード):ボーカル(レベル9)、その他(レベル0)、ピアノ(レベル0)、ドラム(レベル0)、キーボード(レベル0)
□プリセット2(MRモード):ボーカル(レベル8)、その他(レベル8)、ピアノ(レベル8)、ドラム(レベル8)、キーボード(レベル8)
□プリセット3(カラオケモード):ボーカル(レベル0)、その他(レベル9)、ピアノ(レベル9)、ドラム(レベル9)、キーボード(レベル9)
上述したように3つのプリセットを設定した後、設定されたプリセット、プリセットの数、プリセット名などは、該当の多重オブジェクトオーディオコンテンツファイルのビットストリームに格納される。
以後、ユーザは、1つの音楽コンテンツからボーカル(Vocal)モード、MRモード、カラオケ(Karaoke)モードのうちのいずれか1つを選択して聴取できるようになる。
以上、編集者側のオーディオエンコーディング装置に適用されるオーディオプリセット(編集者定義プリセット)生成方法について説明したが、これはユーザのコンテンツ再生端末に適用されるオーディオプリセット(ユーザ定義プリセット)生成方法にも同じように適用される。
図7は、本発明に係る編集者側オーディオエンコーディング装置の画面構成図であり、入力されたオーディオオブジェクトを介して多様なオーディオプリセットを生成する場合を示す。図7において、プリセット1(フル(Full))と関連した1(−1 0 0)(0.9)において、「1」はオブジェクト、「(−1 0 0)」は3次元空間上の位置、「(0.9)」はオブジェクト信号のレベルを示す。
図8は、本発明に係るユーザのコンテンツ再生端末の画面構成図である。
ユーザのコンテンツ再生端末では、プリセット名をユーザに示し、ユーザが特定のプリセットを選択すれば、該当のプリセット情報による該当のオブジェクトのレベル、位置情報を用いてオーディオ場面を構成する。
ユーザがプリセットを設定する場合、オーディオオブジェクト名(TAG Name)をユーザに示し、該当のオブジェクトのレベルおよび位置をユーザが設定できるようにした後、ユーザが設定した情報を格納してユーザプリセット(ユーザが定義したプリセット)を生成する。
図9は、本発明に係る多重オブジェクトオーディオコンテンツファイルの編集方法に対する一実施形態を示すフローチャートであり、ユーザのコンテンツ再生端末における多重オブジェクトオーディオコンテンツファイルの編集過程を示す。
ユーザのコンテンツ再生端末は、多重オブジェクトオーディオコンテンツファイルに対するオブジェクト情報およびオーディオプリセット情報を出力する(900)。このとき、ユーザは、オブジェクトまたは/およびプリセットを変更しようとする場合には、所望する変更要求事項を入力する。そして、オーディオプリセット情報には、オーディオプリセット、プリセット関連情報などが含まれるが、これは多重オブジェクトオーディオコンテンツファイル内に格納されていたり、または多重オブジェクトオーディオコンテンツファイルとは別途の独立ファイルに格納されている。
この後、コンテンツ再生端末は、ユーザの要求に応じて多重オブジェクトオーディオコンテンツファイルに対するオブジェクトまたは/およびプリセットを変更する(902)。
図には示していないが、オーディオプリセット情報が別途の独立ファイルに格納されている場合には、ユーザの要求に応じて事後的に該当の多重オブジェクトオーディオコンテンツファイルに格納することができる。
このような編集方法を介して、ユーザは、既存のオブジェクト基盤オーディオコンテンツファイルにおいて特定のオーディオオブジェクトを除去、変更(新たなオーディオオブジェクトに交換)したり、新なたオーディオオブジェクトを追加して新たなコンテンツファイルを生成することができる。例えば、音楽コンテンツに自身が直接歌った歌を1つのオブジェクトとして追加して他人に配布することができる。また、ユーザは、それぞれのオブジェクトのレベルおよび位置などの情報を自身の趣向によって新たに定義した後、この情報を該当のコンテンツファイル内部や外部の別途のファイルに格納することができる。
図10は、本発明に係る多重オブジェクトオーディオコンテンツファイルの再生方法に対する一実施形態を示すフローチャートであり、ユーザのコンテンツ再生端末で実行される多重オブジェクトオーディオコンテンツファイルの再生過程を示す。
ます、ユーザの要請に応じて、コンテンツ再生端末は、多重オブジェクトオーディオコンテンツファイルを分析した後(1000)、この分析結果から多重オブジェクトオーディオコンテンツファイルのオブジェクトフレームの位置に対する索引情報を取得する(1002)。ここで、多重オブジェクトオーディオコンテンツファイルは、再生時刻が同じフレームが同じフレームグループに格納されているファイルとすることができ、この場合には、該当のフレームグループに属する1番目のフレームの位置情報が該当の索引情報となるであろう。これとは異なり、多重オブジェクトオーディオコンテンツファイルがオブジェクトフレームがオブジェクト別に格納されているファイルである場合には、再生時刻が同じフレームに対する個別位置情報が該当の索引情報となる。
この後、コンテンツ再生端末は、取得した索引情報を用いて再生時刻が同じオブジェクトフレームを検索して多重オブジェクトオーディオコンテンツファイルを再生する(1004)。
図10には示していないが、コンテンツ再生端末は、ユーザの要請に応じて多重オブジェクトオーディオコンテンツに対するオーディオプリセットの種類を出力し、これによってユーザから選択されたオーディオプリセットの設定情報を用いて該当のオーディオ場面を構成する機能をさらに実行する。ここで、オーディオプリセット情報は、多重オブジェクトオーディオコンテンツファイル内に格納されていたり、または多重オブジェクトオーディオコンテンツファイルとは別途の独立ファイルに格納されている。
上述したような本発明の方法は、プログラムで実現されてコンピュータで読み取ることができる形態であり、記録媒体(CD−ROM、RAM、ROM、フロッピーディスク、ハードディスク、光磁気ディスクなど)に格納されることができる。このような過程は、本発明が属する技術分野において通常の知識を有する者が容易に実施することができるため、これ以上の詳しい説明は省略することにする。
以上で説明した本発明は、本発明が属する技術分野において通常の当業者によって、本発明の技術的思想を逸脱しない範囲内で多様な置換、変形、および変更が可能であるため、上述した実施形態および添付の図面によって制限されるものではない。

Claims (10)

  1. 多重オブジェクトオーディオコンテンツファイルの再生方法であって、
    複数のオーディオオブジェクトを含む多重オブジェクトオーディオコンテンツファイル、前記オーディオオブジェクトの特性に関連する少なくとも1つのプリセットを受信するステップと、
    前記プリセットのうちユーザが選択したプリセットまたはユーザが選択してオーディオオブジェクトの特性を制御したプリセットを用いて多重オブジェクトオーディオコンテンツファイルを再生するステップと、
    を含み、
    前記プリセットは、3次元オーディオ場面を提供するために前記オーディオブジェクトを制御するための3次元空間上の位置、信号レベルを含み、
    前記少なくとも1つのプリセットは、前記多重オブジェクトオーディオコンテンツファイルの内部に格納されたり、または前記多重オブジェクトオーディオコンテンツと区別される独立的な別のファイルに格納され、
    前記再生するステップは、
    ユーザの要請に応じて別のファイルに格納されているプリセットが選択される場合、前記選択されたプリセットまたはユーザによってオーディオブジェクトの3次元空間上の位置または信号レベルに制御されたプリセットに応じて前記多重オブジェクトオーディオコンテンツを再生する、多重オブジェクトオーディオコンテンツファイルの再生方法。
  2. 前記多重オブジェクトオーディオコンテンツファイルを再生するステップは、編集者が作成した少なくとも1つのプリセットのうちユーザが選択したプリセットを用いて多重オブジェクトオーディオコンテンツファイルを再生することを特徴とする請求項1に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  3. 前記多重オブジェクトオーディオコンテンツファイルを再生するステップは、前記編集者が作成した少なくとも1つのプリセットのうちユーザが選択してオーディオオブジェクトの3次元空間上の位置、信号レベル、または反響情報が編集されたプリセットを用いて多重オブジェクトオーディオコンテンツファイルを再生することを特徴とする請求項1に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  4. 前記多重オブジェクトオーディオコンテンツファイルは、少なくとも1つのオーディオプリセット情報に対する全体個数またはプリセット名を含むプリセット関連情報をさらに含み、
    前記ユーザは、プリセット関連情報に基づいてプリセットを選択することを特徴とする請求項1に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  5. 前記多重オブジェクトオーディオコンテンツファイルを再生するステップは、 多重オブジェクトオーディオコンテンツファイルでユーザが特定オーディオオブジェクトを除去したり、新しいオーディオオブジェクトに交換したり、または新しいオーディオオブジェクトを追加することによってユーザが編集した多重オブジェクトオーディオコンテンツファイルを再生することを特徴とする請求項1に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  6. 多重オブジェクトオーディオコンテンツファイルの再生方法であって、
    複数のオーディオオブジェクトを含む多重オブジェクトオーディオコンテンツファイルおよび前記オーディオオブジェクトに関連する少なくとも1つのプリセットを受信するステップと、
    ユーザから前記プリセットのうちいずれか1つのプリセットの選択要請と多重オブジェクトオーディオコンテンツファイルに含まれたオーディオオブジェクトの制御要請を受信するステップと、
    前記選択されたプリセットに基づいて前記制御要請が反映された多重オブジェクトオーディオコンテンツファイルを再生するステップと、
    を含み、
    前記オーディオオブジェクトの制御要請は、ユーザが多重オブジェクトオーディオコンテンツファイルで特定オーディオオブジェクトを除去したり、新しいオーディオオブジェクトに交換したり、または新しいオーディオオブジェクトを追加する要請を含み、
    前記プリセットは、3次元オーディオ場面を提供するために前記オーディオブジェクトを制御するための3次元空間上の位置、信号レベルを含み、
    前記少なくとも1つのプリセットは、前記多重オブジェクトオーディオコンテンツファイルの内部に格納されたり、または前記多重オブジェクトオーディオコンテンツと区別される独立的な別のファイルに格納され、
    前記再生するステップは、
    ユーザの要請に応じて別のファイルに格納されているプリセットが選択される場合、前記選択されたプリセットまたはユーザによってオーディオブジェクトの3次元空間上の位置または信号レベルに制御されたプリセットに応じて前記多重オブジェクトオーディオコンテンツを再生する、多重オブジェクトオーディオコンテンツファイルの再生方法。
  7. 前記少なくとも1つのオーディオプリセットに対する全体個数またはプリセット名を含むプリセット関連情報を受信するステップを含み、
    前記ユーザは、プリセット関連情報に基づいて少なくとも1つのオーディオプリセットで再生しようとする多重オブジェクトオーディオコンテンツファイルに関連するプリセットを選択することを特徴とする請求項に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  8. 前記少なくとも1つのプリセットは、前記多重オブジェクトオーディオコンテンツファイルの内部に格納されたり、または前記多重オブジェクトオーディオコンテンツファイルと別個のファイルに格納されることを特徴とする請求項に記載の多重オブジェクトオーディオコンテンツファイルの再生方法。
  9. 多重オブジェクトオーディオコンテンツファイルの再生方法であって、
    複数のオーディオオブジェクトを含む多重オブジェクトオーディオコンテンツファイル、前記オーディオオブジェクトの特性に関連する少なくとも1つのプリセットを受信するステップと、
    前記少なくとも1つのプリセットのうちユーザが選択したプリセットに含まれたオーディオオブジェクトそれぞれの3次元空間上の位置の制御要請を受信するステップと、
    前記3次元空間上の位置が制御されたオーディオオブジェクトに基づいて多重オブジェクトオーディオコンテンツファイルを再生するステップと、
    を含み、
    前記少なくとも1つのプリセットは、前記多重オブジェクトオーディオコンテンツファイルの内部に格納されたり、または前記多重オブジェクトオーディオコンテンツファイルと別のファイルに格納され、
    前記少なくとも1つのプリセットが前記多重オブジェクトオーディオコンテンツファイルと別のファイルに格納されている場合には、ユーザの要請に応じて該当の多重オブジェクトオーディオコンテンツファイルに格納する、多重オブジェクトオーディオコンテンツファイルの再生方法。
  10. 多重オブジェクトオーディオコンテンツファイルの再生方法であって、
    複数のオーディオオブジェクトを含む多重オブジェクトオーディオコンテンツファイルおよび前記オーディオオブジェクトの特性に関連する少なくとも1つのプリセットを受信するステップと、
    前記少なくとも1つのプリセットのうちユーザが選択したプリセットの制御要請を受信するステップと、
    前記制御要請が反映されたプリセットに基づいて多重オブジェクトオーディオコンテンツファイルを再生するステップと、
    を含み、
    前記制御要請は、ユーザが選択したプリセットに対してユーザがオーディオオブジェクトの3次元空間上の位置、信号レベル、または反響情報を編集する要請であり
    前記少なくとも1つのプリセットは、前記多重オブジェクトオーディオコンテンツファイルの内部に格納されたり、または前記多重オブジェクトオーディオコンテンツファイルと別のファイルに格納され、
    前記少なくとも1つのプリセットが前記多重オブジェクトオーディオコンテンツファイルと別のファイルに格納されている場合には、ユーザの要請に応じて該当の多重オブジェクトオーディオコンテンツファイルに格納する、多重オブジェクトオーディオコンテンツファイルの再生方法。
JP2012097550A 2007-02-16 2012-04-23 オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法 Active JP5840560B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2007-0016744 2007-02-16
KR20070016744A KR100868475B1 (ko) 2007-02-16 2007-02-16 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009549534A Division JP4982570B2 (ja) 2007-02-16 2008-02-18 オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法

Publications (2)

Publication Number Publication Date
JP2012168552A JP2012168552A (ja) 2012-09-06
JP5840560B2 true JP5840560B2 (ja) 2016-01-06

Family

ID=39690287

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009549534A Active JP4982570B2 (ja) 2007-02-16 2008-02-18 オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法
JP2012097550A Active JP5840560B2 (ja) 2007-02-16 2012-04-23 オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009549534A Active JP4982570B2 (ja) 2007-02-16 2008-02-18 オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法

Country Status (5)

Country Link
US (1) US9135953B2 (ja)
EP (1) EP2113112B1 (ja)
JP (2) JP4982570B2 (ja)
KR (1) KR100868475B1 (ja)
WO (1) WO2008100119A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
KR101596504B1 (ko) 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
EP2146342A1 (en) * 2008-07-15 2010-01-20 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN102099854B (zh) 2008-07-15 2012-11-28 Lg电子株式会社 处理音频信号的方法和装置
KR101129974B1 (ko) 2008-12-22 2012-03-28 (주)오디즌 객체 기반 오디오 컨텐츠 생성/재생 방법 및 그 장치
WO2010147442A1 (ko) * 2009-06-19 2010-12-23 한국전자통신연구원 프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법
KR101473035B1 (ko) 2009-06-19 2014-12-16 한국전자통신연구원 프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법
KR101278813B1 (ko) * 2009-08-28 2013-06-25 한국전자통신연구원 객체기반 오디오 서비스를 위한 비트스트림 구조화 방법, 비트스트림 구조화 장치 및 비트스트림 부호화 장치
KR101125364B1 (ko) * 2009-09-24 2012-03-27 한국전자통신연구원 객체기반 오디오 파일 제공 장치 및 객체기반 오디오 파일 재생 장치, 그리고, 객체기반 오디오 파일 제공 방법 및 객체기반 오디오 재생 방법
US20110069934A1 (en) * 2009-09-24 2011-03-24 Electronics And Telecommunications Research Institute Apparatus and method for providing object based audio file, and apparatus and method for playing back object based audio file
WO2011071336A2 (ko) * 2009-12-11 2011-06-16 한국전자통신연구원 객체 기반 오디오 서비스를 위한 오디오 저작 장치 및 오디오 재생 장치, 이를 이용하는 오디오 저작 방법 및 오디오 재생 방법
KR101092663B1 (ko) 2010-04-02 2011-12-13 전자부품연구원 실감 객체 오디오 재생 및 생성 장치
US8755432B2 (en) 2010-06-30 2014-06-17 Warner Bros. Entertainment Inc. Method and apparatus for generating 3D audio positioning using dynamically optimized audio 3D space perception cues
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
US8917774B2 (en) 2010-06-30 2014-12-23 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
WO2012037073A1 (en) 2010-09-13 2012-03-22 Warner Bros. Entertainment Inc. Method and apparatus for generating 3d audio positioning using dynamically optimized audio 3d space perception cues
US9411882B2 (en) * 2013-07-22 2016-08-09 Dolby Laboratories Licensing Corporation Interactive audio content generation, delivery, playback and sharing
US9367283B2 (en) 2014-07-22 2016-06-14 Sonos, Inc. Audio settings
US10032447B1 (en) * 2014-11-06 2018-07-24 John Mitchell Kochanczyk System and method for manipulating audio data in view of corresponding visual data
SE1530010A1 (sv) * 2015-02-03 2016-06-14 100 Milligrams Holding Ab A mix instructions file for controlling a music mix, a computer program product and a computer device
BR112017026915B1 (pt) * 2015-06-17 2023-09-26 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Processador e codificador de áudio e método para processar e gerar sinal de áudio
DE102015223935A1 (de) * 2015-12-01 2017-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System zur Ausgabe von Audio-Signalen sowie zugehöriges Verfahren und Einstellvorrichtung
US9886234B2 (en) 2016-01-28 2018-02-06 Sonos, Inc. Systems and methods of distributing audio to one or more playback devices
US10349196B2 (en) 2016-10-03 2019-07-09 Nokia Technologies Oy Method of editing audio signals using separated objects and associated apparatus
KR20190112971A (ko) 2018-03-27 2019-10-08 디큐브랩 주식회사 다중 음원 트랙 콘텐츠의 생성방법, 재생방법 및 다중 음원 트랙 콘텐츠
US11606663B2 (en) 2018-08-29 2023-03-14 Audible Reality Inc. System for and method of controlling a three-dimensional audio engine

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3263996B2 (ja) * 1992-10-21 2002-03-11 キヤノン株式会社 番組制作装置、情報伝送方法及び再生装置
JPH11272156A (ja) * 1998-03-25 1999-10-08 Sega Enterp Ltd 仮想三次元音像生成装置及びその方法並びに媒体
KR100305368B1 (ko) * 1998-10-29 2001-11-22 오길록 객체관리기 프레임워크의 동적 객체생성 및삭제방법
JP2000267675A (ja) * 1999-03-16 2000-09-29 Sega Enterp Ltd 音響信号処理装置
JP4489248B2 (ja) * 1999-06-02 2010-06-23 パナソニック株式会社 光ディスク、光ディスクに対してデータの記録、再生を行なう装置及び方法
US6559845B1 (en) * 1999-06-11 2003-05-06 Pulse Entertainment Three dimensional animation system and method
CN1194537C (zh) * 1999-07-29 2005-03-23 夏普公司 数据访问位置定位方法
JP4416289B2 (ja) 1999-07-29 2010-02-17 シャープ株式会社 記録媒体のアクセス位置特定方法及び記録媒体の管理装置
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
JP4304845B2 (ja) * 2000-08-03 2009-07-29 ソニー株式会社 音声信号処理方法及び音声信号処理装置
KR20020032803A (ko) * 2000-10-27 2002-05-04 구자홍 스트리밍 서비스를 위한 파일 구조
JP2002196794A (ja) * 2000-12-25 2002-07-12 Olympus Optical Co Ltd 音声記録再生装置
KR100424677B1 (ko) 2001-04-16 2004-03-27 한국전자통신연구원 객체 기반의 대화형 멀티미디어 컨텐츠 저작 장치 및 그방법
JP2002369152A (ja) * 2001-06-06 2002-12-20 Canon Inc 画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムが記憶されたコンピュータにより読み取り可能な記憶媒体
JP3569245B2 (ja) * 2001-09-14 2004-09-22 株式会社東芝 オーディオ情報の記録、編集、再生方法及び情報記憶媒体
KR100479478B1 (ko) * 2002-07-26 2005-03-31 연세대학교 산학협력단 객체별 중요도를 고려한 객체 기반의 트랜스코딩 방법 및그 장치
JP2004126214A (ja) 2002-10-02 2004-04-22 Canon Inc オーディオ処理装置及びその方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
BRPI0315326B1 (pt) 2002-10-14 2017-02-14 Thomson Licensing Sa método para codificar e decodificar a largura de uma fonte de som em uma cena de áudio
EP1552724A4 (en) 2002-10-15 2010-10-20 Korea Electronics Telecomm METHOD FOR GENERATING AND USING A 3D AUDIOSCENCE WITH EXTENDED EFFICIENCY OF SOUND SOURCE
KR100542129B1 (ko) 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
JP2005094271A (ja) * 2003-09-16 2005-04-07 Nippon Hoso Kyokai <Nhk> 仮想空間音響再生プログラムおよび仮想空間音響再生装置
JP2005150993A (ja) 2003-11-13 2005-06-09 Sony Corp オーディオデータ処理装置、およびオーディオデータ処理方法、並びにコンピュータ・プログラム
JP2005284191A (ja) * 2004-03-30 2005-10-13 Advanced Telecommunication Research Institute International 音声波形データ表示装置及びそのためのコンピュータプログラム
JP2005322125A (ja) * 2004-05-11 2005-11-17 Sony Corp 情報処理システム、情報処理方法、プログラム
JP2005352330A (ja) * 2004-06-14 2005-12-22 Heartful Wing:Kk 音声分割記録装置
KR100602781B1 (ko) * 2004-07-27 2006-07-20 주식회사 현대오토넷 오디오 파일 재생 시스템에서 오디오 파일 랜덤 재생 장치및 방법
WO2006010951A1 (en) * 2004-07-30 2006-02-02 U-Myx Limited Multi-channel audio data distribution format, method and system
DE102005008342A1 (de) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
JP2006267226A (ja) * 2005-03-22 2006-10-05 Yamaha Corp 楽音制御装置
JP2006287878A (ja) * 2005-04-05 2006-10-19 Matsushita Electric Ind Co Ltd 携帯電話端末
JP2007027846A (ja) * 2005-07-12 2007-02-01 Oki Electric Ind Co Ltd 動画再生システム及び動画再生方法

Also Published As

Publication number Publication date
JP4982570B2 (ja) 2012-07-25
US20100076577A1 (en) 2010-03-25
JP2010519802A (ja) 2010-06-03
EP2113112A4 (en) 2011-12-21
JP2012168552A (ja) 2012-09-06
EP2113112A1 (en) 2009-11-04
WO2008100119A1 (en) 2008-08-21
KR20080095928A (ko) 2008-10-30
KR100868475B1 (ko) 2008-11-12
EP2113112B1 (en) 2019-07-03
US9135953B2 (en) 2015-09-15

Similar Documents

Publication Publication Date Title
JP5840560B2 (ja) オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法
US11410704B2 (en) Generation and use of user-selected scenes playlist from distributed digital content
JP5514803B2 (ja) オブジェクトベースのオーディオコンテンツの生成/再生方法、およびオブジェクトベースのオーディオサービスのためのファイルフォーマット構造を有するデータを記録したコンピュータ読み出し可能記録媒体
CN110603537B (zh) 增强的内容跟踪系统和方法
US8451832B2 (en) Content using apparatus, content using method, distribution server apparatus, information distribution method, and recording medium
US20060087925A1 (en) Content using apparatus, content using method, distribution server apparatus, infomation distribution method, and recording medium
KR101963753B1 (ko) 음악의 분절별 동영상 재생 방법 및 장치
EP2060980A2 (en) Server and client device, and information processing system and method
JP2002202982A (ja) 情報シーケンス保存装置及び情報シーケンス保存方法
KR100963005B1 (ko) 자유시점 av 서비스에 따른 파일 생성 방법
JP2007537483A (ja) マルチメディア音楽コンテンツのサービス方法及びシステム
JP2009004999A (ja) 映像データ管理装置
KR20140132209A (ko) 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치
KR20090052780A (ko) 객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일구조
JP2021129127A (ja) 受信装置、送信装置、受信方法、送信方法、およびプログラム
JP2006108843A (ja) 再生装置と再生方法
KR102149019B1 (ko) 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
US12009014B2 (en) Generation and use of user-selected scenes playlist from distributed digital content
KR20090015744A (ko) 객체 미디어 교체가 가능한 멀티미디어 데이터 생성 방법및 장치 그리고 재구성 방법 및 장치
KR101275555B1 (ko) 멀티 미디어 재생 방법 및 장치와 이를 위한 멀티 미디어파일 포맷
JP2024501519A (ja) オーディオアレンジメントの生成及びミキシング
JP2004152327A (ja) 音楽記録再生装置及び方法
KR101125364B1 (ko) 객체기반 오디오 파일 제공 장치 및 객체기반 오디오 파일 재생 장치, 그리고, 객체기반 오디오 파일 제공 방법 및 객체기반 오디오 재생 방법
Mason et al. Research White Paper
JP2005148983A (ja) メニュー作成装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140801

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140811

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20141031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151111

R150 Certificate of patent or registration of utility model

Ref document number: 5840560

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250