JP6912612B2 - 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体 - Google Patents

動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体 Download PDF

Info

Publication number
JP6912612B2
JP6912612B2 JP2020018862A JP2020018862A JP6912612B2 JP 6912612 B2 JP6912612 B2 JP 6912612B2 JP 2020018862 A JP2020018862 A JP 2020018862A JP 2020018862 A JP2020018862 A JP 2020018862A JP 6912612 B2 JP6912612 B2 JP 6912612B2
Authority
JP
Japan
Prior art keywords
audio data
channel audio
format
reproduction
format conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020018862A
Other languages
English (en)
Other versions
JP2020092439A (ja
Inventor
ユ、ジェ、ヒョン
イ、テ、ジン
イ、ソク、ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2020092439A publication Critical patent/JP2020092439A/ja
Priority to JP2021113487A priority Critical patent/JP7166398B2/ja
Application granted granted Critical
Publication of JP6912612B2 publication Critical patent/JP6912612B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は多チャネルオーディオデータ再生方法に関し、より詳しくは、多チャネルオーディオデータの様々なフォーマット間の変換方法に関する。
3DTV、3Dシネマ、UHDTVなど次世代コンテンツ再生環境に対する研究開発が持続しながら、オーディオも多チャネルラウドスピーカを用いる音響再生環境に素早い変化が行われている。
映画館及びHDTVのための立体音響の5.1チャネルシステム以後に上りチャネルを含む様々なマルチャネルオーディオシステムが導入され、ITU−R(International Telecommunication Union Radiocommunications Sector)では、最近Recommendation BS.2051を制定して10.2チャネル、13.1チャネル、22.2チャネルなどをはじめとする総8個の多チャネルフォーマットを次世代オーディオシステム(advanced sound system)として定義した。したがって、これからは様々なフォーマットにベースを置いたオーディオコンテンツが製造される可能性が極めて高まっている。
このような環境では、1つのフォーマットに製造されたコンテンツが異なるフォーマットに再生する可能性も極めて高いため、コンテンツ間の適切な変換方法が求められている。従来には、コンテンツの多チャネルオーディオフォーマットから再生環境側の新しい多チャネルオーディオフォーマットにフォーマット変換することにおいて一括的な変換を行った。しかし、このような一括の変換方法は、コンテンツ著作者の著作意図を毀損し、意図とは異なる変換を行う恐れがあるという短所がある。
本発明の目的は、多チャネルオーディオデータの様々なフォーマット間に著作者の著作意図が完全に保持されるようにフォーマットを変換する動的フォーマット変換方法を提供するためのオーディオメタデータ提供装置、方法及び動的フォーマット変換方法によりフォーマットを変換して再生する装置、方法、並びに動的フォーマット変換方法が記録された記録媒体を提案する。
本発明の目的は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境による第2フォーマットとの間の変換を行うことのできる動的フォーマット変換情報が含まれたオーディオメタデータを生成できるオーディオメタデータ提供装置及び方法を提供する。
本発明の目的は、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータを識別して第1フォーマットから第2フォーマットに多チャネルオーディオデータを変換した後再生する多チャネルオーディオデータ再生装置及び方法を提供する。
本発明の目的は、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータが記録されたコンピュータで読み出し可能な記録媒体を提供する。
本発明の一実施形態に係るオーディオメタデータ提供装置は、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別する変換情報識別部と、前記識別された動的フォーマット変換情報を含むオーディオメタデータを生成するオーディオメタデータ生成部とを含む。
前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
前記複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
前記複数のフォーマット変換方式は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含んでもよい。
前記動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定されてもよい。
本発明の一実施形態に係る多チャネルオーディオデータ再生装置は、第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するデータ識別部と、前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するオーディオデータ変換部と、前記第2フォーマットに変換された多チャネルオーディオデータを再生するオーディオデータ再生部とを含む。
前記多チャネルオーディオデータ変換部の再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
前記多チャネルオーディオデータ変換部のフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換してもよい。
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
本発明の一実施形態に係るオーディオメタデータ提供方法は、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、前記識別された動的フォーマット変換情報を含むオーディオメタデータを生成するステップとを含む。
前記複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
前記複数のフォーマット変換方式は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含んでもよい。
前記動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定されてもよい。
本発明の一実施形態に係る多チャネルオーディオデータ再生方法は、第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するステップと、前記第2フォーマットに変換された多チャネルオーディオデータを再生するステップとを含む。
前記多チャネルオーディオデータ変換部の再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
前記多チャネルオーディオデータ変換部のフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換してもよい。
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
本発明の一実施形態に係るコンピュータで読み出し可能な記録媒体は、1つ以上のチャネルから構成された多チャネルオーディオデータと、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報が含まれたオーディオメタデータとが記録される。
本発明の一実施形態によると、多チャネルオーディオデータの様々なフォーマット間に著作者の著作意図が完全に保持されるよう、フォーマットを変換する動的フォーマット変換方法を提供するためのオーディオメタデータ提供装置、方法、及び動的フォーマット変換方法によりフォーマットを変換して再生する装置、方法、並びに動的フォーマット変換方法が記録された記録媒体を提供することができる。
本発明の一実施形態によると、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の変換を行うことのできる動的フォーマット変換情報が含まれたオーディオメタデータを生成できるオーディオメタデータ提供装置及び方法を提供することができる。
本発明の一実施形態によると、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータを識別し、第1フォーマットから第2フォーマットに多チャネルオーディオデータを変換した後、再生する多チャネルオーディオデータ再生装置及び方法を提供することができる。
本発明の一実施形態によると、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータが記録されたコンピュータで読み出し可能な記録媒体を提供することができる。
本発明の一実施形態に係るオーディオメタデータ提供装置とオーディオメタデータ及び多チャネルオーディオデータ再生装置を示す図である。 本発明の一実施形態に係る多チャネルオーディオデータのフォーマットを一括的に変換する一例を示す図である。 本発明の一実施形態に係る動的フォーマット変換情報に多チャネルオーディオデータのフォーマットを変換する一例を示す図である。 本発明の一実施形態に係る1つ以上の動的フォーマット変換情報を含むオーディオメタデータを示す図である。 本発明の一実施形態に係るマトリックス方式を用いてフォーマット間の変換を行う実施形態を説明するための図である。 本発明の一実施形態に係るオーディオメタデータ提供装置が動的フォーマット変換情報の含まれたオーディオメタデータを提供する動作を示したフローチャートである。 本発明の一実施形態に係る多チャネルオーディオデータ再生装置が多チャネルオーディオデータのフォーマットを変換した後、これを再生する動作を示したフローチャートである。
以下、本発明の実施形態について添付の図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係るオーディオメタデータ提供装置110とオーディオメタデータ140及び多チャネルオーディオデータ再生装置160を示す図である。
図1を参考すると、オーディオメタデータ提供装置110は、動的フォーマット変換情報を識別する変換情報識別部120及び識別された動的フォーマット変換情報を含むオーディオメタデータ140を生成するオーディオメタデータ生成部130を含む。動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
本発明の一実施形態によると、変換情報識別部120は、多チャネルオーディオデータの著作者から動的フォーマット変換情報を識別する。更なる実施形態によると、変換情報識別部120は、1つ以上のオーディオメタデータから複数の動的フォーマット変換情報を識別する。
本発明の一実施形態によると、変換情報識別部120で識別された動的フォーマット変換情報に基づいてオーディオメタデータを生成するオーディオメタデータ生成部130が提供される。オーディオメタデータ生成部130は、オーディオメタデータに識別された複数の動的フォーマット変換情報を含む。本発明の一実施形態によると、オーディオメタデータ生成部130は、動的フォーマット変換情報の各フォーマット変換方式をマトリックスの形態に含むことができる。更なる実施形態によると、オーディオメタデータ生成部130は、メタデータに識別された動的フォーマット変換情報と共に、メタデータに一般的に含まれる情報(例えば、著作者、レコード名、発売年度など)を含んでもよい。
本発明の一実施形態によると、オーディオメタデータ提供装置110は、多チャネルオーディオデータ提供装置の一部の構成として含まれている。
オーディオメタデータ提供装置110から動的フォーマット変換情報150を含むオーディオメタデータ140が提供される。本発明の一実施形態によると、オーディオメタデータ140は、動的フォーマット変換情報150だけではなく、メタデータに一般的に含まれる情報を含んでもよい。本発明の他の一実施形態によると、オーディオメタデータは、多チャネルオーディオデータと共に提供され得る。本発明の更なる一実施形態によると、オーディオメタデータ140は、リアルタイムで多チャネルオーディオデータ再生装置160に送信されたり、又は、多チャネルオーディオデータ再生装置160に予め送信されて多チャネルオーディオデータ再生装置160のバッファ、メモリのような格納媒体に格納され得る。又は、オーディオメタデータ140は、CD−ROM、CD−RW、DVD−R、DVD−RWなどのような光記録媒体に格納されて配布され得る。
多チャネルオーディオデータを動的フォーマット変換情報によってフォーマット間に変換した後、これを再生できる多チャネルオーディオデータ再生装置160が提供される。
多チャネルオーディオデータ再生装置160は、動的フォーマット変換情報を識別するデータ識別部170、識別された動的フォーマット変換情報でフォーマット間の変換を行うオーディオデータ変換部180、及び変換された多チャネルオーディオデータを再生するオーディオデータ再生部190を含む。
本発明の一実施形態によると、データ識別部170は、オーディオメタデータ140で多チャネルオーディオデータの再生環境に基づいた第2フォーマットに該当する動的フォーマット変換情報を識別する。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。本発明の一実施形態によると、データ識別部170は、オーディオメタデータに記録された1つ以上の動的フォーマット変換情報のうち、第2フォーマットに対応する動的フォーマット変換情報を選択して識別することができる。
本発明の一実施形態によると、オーディオデータ変換部180は、識別した動的フォーマット変換情報によって多チャネルオーディオデータを多チャネルオーディオ著作者が設定した第1フォーマットから多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換する。動的フォーマット変換情報は、第1フォーマットと第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
本発明の一実施形態によると、オーディオデータ変換部180は、再生時間により動的フォーマット変換情報から再生時間を含む再生区間を識別し、動的フォーマット変換情報で当該再生区間に設定されたフォーマット変換方式を識別して第1フォーマットと第2フォーマットとの間のフォーマット変換を行う。本発明の一実施形態によると、複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。本発明の一実施形態によると、オーディオデータ変換部180は、動的フォーマット変換情報によって再生区間ごとに互いに異なるフォーマット変換方式を用いて変換するか、又は部分的にフォーマット変換方式を繰り返されるように用いて変換することができる。
本発明の一実施形態によると、第2フォーマットに変換された多チャネルオーディオデータを再生するオーディオデータ再生部190が提供される。第2フォーマットは多チャネルオーディオデータの再生環境に基づいて、多チャネルオーディオデータの再生環境は多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。オーディオデータ再生部190は、1つ以上のスピーカの出力部から構成される。オーディオデータ再生部190は、第2フォーマットに変換された多チャネルオーディオデータに対して各チャネルに対応するスピーカからオーディオデータを出力する。
本発明の一実施形態によると、オーディオデータ再生部190は、出力部に接続されたスピーカの個数を把握して多チャネルオーディオデータの再生環境を識別する。さらに、オーディオデータ再生部190は、スピーカの個数だけではなく、各スピーカの位置を識別したり、ユーザから再生環境に関する情報が入力されることで再生環境を識別することができる。
図2は、本発明の一実施形態に係る多チャネルオーディオデータのフォーマットを一括的に変換する一例を示す図である。
多チャネルオーディオデータは、多チャネルオーディオデータの著作者が設定した多チャネルオーディオデータフォーマットの第1フォーマットに合わせて製作される。多チャネルオーディオデータを再生する側の多チャネルオーディオデータフォーマットの第2フォーマットは、多チャネルオーディオデータの再生環境に基づく。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されるため、第2フォーマットは、多チャネルオーディオデータの第1フォーマットと異なり得る。本発明の一実施形態によると、多チャネルオーディオデータの再生環境に基づく第2フォーマットが第1フォーマットと異なる場合、多チャネルオーディオデータ再生装置のオーディオデータ変換部は、一括的なフォーマット変換方式200により変換を行うことができる。
図2を参照すると、第1フォーマットは、10.2チャネルフォーマットであると仮定する。一括的なフォーマット変換方式200によると、第2フォーマットが5.1チャネルフォーマットである場合、聴者の左側の前面スピーカLは第1フォーマットの左側の前面スピーカLと左側上段スピーカLHの線形結合(linear combination)として決定される。他の例として、第2フォーマットが7.1チャネルフォーマットである場合、右側の後面スピーカRBは、第1フォーマットの右側の後面スピーカRBと中央スピーカCHの線形結合に決定される。
一括的なフォーマット変換方式200によると、フォーマット変換方式はチャネル間の線形結合であることから、非線形変換はできない。また、再生区間ごとにフォーマット変換方式は変化されない。本発明の一実施形態によると、多チャネルオーディオデータの再生区間ごとに1つ以上のフォーマット変換方式が設定された 動的フォーマット変換情報が提供される。また、第1フォーマットと第2フォーマットとの間の非線形変換をサポートするフォーマット変換方式が提供される。
図3は、本発明の一実施形態に係る多チャネルオーディオデータのフォーマット変換を行うことのできる動的フォーマット変換情報を示す図である。
図3を参考すると、動的フォーマット変換情報310は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式(例えば、フォーマット変換方式K320、L340、M330)が多チャネルオーディオデータの再生区間ごとに設定されたものである。
本発明の一実施形態によると、それぞれのフォーマット変換方式は、同一の第2フォーマットにフォーマットを変換する。ただし、変換する方式は互いに異なってもよい。図3を参照して説明すると、フォーマット変換方式K320は、第1フォーマットの複数の左側スピーカLeftとLeftの線形結合で第2フォーマットの左側スピーカLeftの出力データを決定する。フォーマット変換方式M330は、第1フォーマットの複数の左側スピーカのうちの1つであるLeftだけで第2フォーマットの左側スピーカLeftの出力データを決定する。本発明の一実施形態によると、それぞれの変換方式は非線形変換を含むことができる。
本発明の一実施形態によると、多チャネルオーディオデータ再生装置は、動的フォーマット変換情報から再生区間ごとに設定されたフォーマット変換方式を識別して変換することができる。図3を参照すると、多チャネルオーディオデータ再生装置は、再生区間t=0からt=tまで多チャネルオーディオデータをフォーマット変換方式K320によって変換する。多チャネルオーディオデータ再生装置は、以後の再生区間t=tからt=tまで多チャネルオーディオデータをフォーマット変換方式M330によって変換する。同様に、多チャネルオーディオデータ再生装置は、再生区間t=tからt=tまではフォーマット変換方式L340によって変換を行い、以後の再生区間でも同じ作業を繰り返す。
本発明の一実施形態によると、動的フォーマット変換情報310は、多チャネルオーディオデータの再生区間ごとにフォーマット変換方式を相異に設定するか、又は部分的に繰り返されるように設定してもよい。図3を参照すると、フォーマット変換方式K320は、再生区間t=0からt=tだけではなく、再生区間t=tからt=tでも再び設定され得る。本発明の一実施形態によると、フォーマット変換方式は、一括的なフォーマット変換方式や線形結合による変換だけではなく、非線形変換も含むことができる。
本発明の一実施形態によると、フォーマット変換方式が設定されたそれぞれの再生区間は互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。図3を参照すると、再生区間t=tからt=tと再生区間t=tからt=tは互いに同じ再生長さを有し得る。
図4は、本発明の一実施形態に係る1つ以上の動的フォーマット変換情報を含むオーディオメタデータを示す図である。
図4を参考すると、多チャネルオーディオデータの再生環境が様々であるため、オーディオメタデータ140は、1つ以上の動的フォーマット変換情報420、430を含む。
多チャネルオーディオデータ再生装置160は、多チャネルオーディオデータの再生環境に基づいた第2フォーマットに該当する動的フォーマット変換情報を選択し、多チャネルオーディオデータのフォーマットを変換する。再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。
図4を参照すると、多チャネルオーディオデータの著作者が設定した第1フォーマットが22.2チャネルフォーマットであり、多チャネルオーディオデータの再生環境に基づいた第2フォーマットが10.2チャネルフォーマットであると仮定する。多チャネルオーディオデータ再生装置160のデータ識別部170は、オーディオメタデータの複数の動的フォーマット変換情報420、430のうち第2フォーマットに対応する動的フォーマット変換情報(1)420を識別する。同様に、多チャネルオーディオデータの再生環境に基づいた第2フォーマットが5.1チャネルフォーマットであれば、多チャネルオーディオデータ再生装置のデータ識別部170は動的フォーマット変換情報(2)430を識別する。
先に仮定した10.2チャネルフォーマットで、オーディオデータ変換部180は、識別された動的フォーマット変換情報(1)420によって多チャネルオーディオデータのフォーマットを変換する。すなわち、オーディオデータ変換部180は、再生区間ごとに設定された複数のフォーマット変換方式440に基づいて多チャネルオーディオデータを再生区間t=0からt=tまではフォーマット変換方式K450によって変換し、再生区間t=tからt=t2まではフォーマット変換方式M460によって変換する。本発明の一実施形態によると、動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定され得る。また、フォーマット変換方式が設定されたそれぞれの再生区間の再生長さも互いに異なるか、同じであってもよい。図4を参考すると、フォーマット変換方式K450は、再生区間t=からt=t1で用いられるが、その後の再生区間でも繰り返し用いてもよい。また、再生区間t=0からt=tと再生区間t=tからt=tの再生長さも互いに異なるか、同じであってもよい。
図5は、本発明の一実施形態に係るマトリックス方式を用いてフォーマット間の変換を行う実施形態を説明するための図である。
図5を参考すると、動的フォーマット変換情報でそれぞれのフォーマット変換方式は、変換マトリックス530、540に格納され得る。変換マトリックスは、多チャネルオーディオデータの著作者が設定した第1フォーマットから多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換するためのマトリックスである。オーディオデータ変換部は、第1フォーマットチャネルマトリックスを変換マトリックスに適用して第2フォーマットチャネルマトリックスを出力することで、第1フォーマットから第2フォーマットに変換することができる。
図5を参照すると、多チャネルオーディオデータの著作者は、10.2チャネルフォーマット(第1フォーマット)に多チャネルオーディオデータを製作510したと仮定し、多チャネルオーディオデータの再生環境は、5.1チャネルフォーマット(第2フォーマット)であると仮定する。この場合、フォーマット変換550を参考すると、オーディオデータ変換部は、第1フォーマットチャネルマトリックス580(チャネルマトリックスの各元素は各チャネルに対応する)を変換マトリックス570に適用して第2フォーマットチャネルマトリックス560を出力する方式によりフォーマットを変換する。したがって、図5に示す場合、第1フォーマットの10.2チャネルフォーマットは12個のチャネルを有し、第2フォーマットの5.1チャネルフォーマットは6個のチャネルを有するため、フォーマット変換方式に関する情報を含む変換マトリックス530、540は6行12列に構成される。
また、オーディオデータ変換部は、再生区間ごとに設定されたフォーマット変換方式に合わせて変換マトリックス570を交換して変換することができる。例えば、図5に示す動的フォーマット変換情報520で、再生区間t=0からt=tまで変換方式Kが設定されているため、当該の再生区間でオーディオデータ変換部は、変換マトリックス570を変換方式Kに対する変換マトリックス530に設定して変換を行う。再生区間t=tからt=tまで変換方式Mが設定されているため、当該の再生区間でオーディオデータ変換部は、変換マトリックス570を変換方式Mに対する変換マトリックス540に設定して変換を行う。
図6は、本発明の一実施形態に係るオーディオメタデータ提供装置が動的フォーマット変換情報の含まれたオーディオメタデータを提供する動作を示したフローチャートである。
ステップS610において、オーディオメタデータ提供装置は、動的フォーマット変換情報を識別する。動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。本発明の一実施形態によると、オーディオメタデータ提供装置は、多チャネルオーディオデータの著作者から動的フォーマット変換情報を識別する。本発明の他の実施形態によると、多チャネルオーディオデータ再生装置は、1つ以上のオーディオメタデータから複数の動的フォーマット変換情報を識別する。
ステップS620において、オーディオメタデータ提供装置は、識別された動的フォーマット変換情報を含むオーディオメタデータを生成する。ここで、オーディオメタデータ提供装置は、オーディオメタデータに一般的に含まれる情報(例えば、著作者、レコード名、発売年度など)を含んでもよい。本発明の一実施形態によると、オーディオメタデータ提供装置は、複数の動的フォーマット変換情報をオーディオメタデータに含み得る。本発明の一実施形態によると、オーディオメタデータ提供装置は、動的フォーマット変換情報の各フォーマット変換方式をマトリックスの形態(例えば、図5に示す変換マトリックス530、540)にオーディオメタデータに記録することができる。
図7は、本発明の一実施形態に係る多チャネルオーディオデータ再生装置が多チャネルオーディオデータのフォーマットを変換した後、これを再生する動作を示したフローチャートである。
ステップS710において、多チャネルオーディオデータ再生装置は、多チャネルオーディオデータ及びオーディオメタデータを受信する。本発明の一実施形態によると、オーディオメタデータは、多チャネルオーディオデータと共に提供されたり、別に提供されてもよい。本発明の一実施形態によると、オーディオメタデータは、リアルタイムで多チャネルオーディオデータ再生装置に受信されたり、又は、多チャネルオーディオデータ再生装置に予め送信されて多チャネルオーディオデータ再生装置のバッファ、メモリのような格納媒体に格納されてもよい。また、オーディオメタデータは、CD−ROM、CD−RW、DVD−R、DVD−RWなどのような光記録媒体に格納されて受信され得る。
ステップS720において、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットが異なる場合、多チャネルオーディオデータ再生装置は、オーディオメタデータで動的フォーマット変換情報を識別することになる。本発明の一実施形態によると、オーディオメタデータは、1つ以上の動的フォーマット変換情報を含んでもよく、この場合、多チャネルオーディオデータ再生装置は、多チャネルオーディオデータ再生装置の第2フォーマットに対応する動的フォーマット変換情報を識別することができる。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。
オーディオメタデータで識別した動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。動的フォーマット変換情報の複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。動的フォーマット変換情報の再生区間ごとに設定されたフォーマット変換方式は、相異に設定されるか、又は部分的に繰り返されるように設定され得る。
ステップS730において、多チャネルオーディオデータ再生装置は、識別した動的フォーマット変換情報によって多チャネルオーディオデータの著作者が設定した第1フォーマットで多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換を行う。本発明の一実施形態によると、変換する再生区間は、動的フォーマット変換情報によって同一の再生長さを有するか、互いに異なる再生長さを有し得る。本発明の一実施形態によると、フォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換したり、部分的に繰り返されるように変換してもよい。
ステップS740において、多チャネルオーディオデータ再生装置は、変換された多チャネルオーディオデータを再生する。多チャネルオーディオデータ再生装置は、第2フォーマットに変換された多チャネルオーディオデータに対して各チャネルに対応するスピーカからオーディオデータを出力する。本発明の一実施形態によると、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとが互いに同一な場合、多チャネルオーディオデータ再生装置は変換を行うことなく、多チャネルオーディオデータを再生することができる。
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータで読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうち1つまたはその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例には、コンパイラによって作られるような機械語コードだけでなく、インタープリタなどを用いてコンピュータによって実行できる高級言語コードが含まれる。前記したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアモジュールとして動作するように構成されてもよく、その逆も同様である。
上述したように、本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。
したがって、本発明の範囲は、開示された実施形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
310:動的フォーマット変換情報
320:フォーマット変換方式K
330:フォーマット変換方式M
340:フォーマット変換方式L

Claims (10)

  1. 第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するデータ識別部と、
    前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するオーディオデータ変換部と、
    前記第2フォーマットに変換された多チャネルオーディオデータを再生するオーディオデータ再生部と、
    を含み、
    前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである、多チャネルオーディオデータ再生装置。
  2. 前記多チャネルオーディオデータ再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有する、請求項1に記載の多チャネルオーディオデータ再生装置。
  3. 前記多チャネルオーディオデータフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換する、請求項1に記載の多チャネルオーディオデータ再生装置。
  4. 前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される、請求項1に記載の多チャネルオーディオデータ再生装置。
  5. 多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、
    前記識別された動的フォーマット変換情報を含むオーディオメタデータを生成するステップと、
    を含み、
    前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである、オーディオメタデータ提供方法。
  6. 前記複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有する、請求項5に記載のオーディオメタデータ提供方法。
  7. 第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、
    前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するステップと、
    前記第2フォーマットに変換された多チャネルオーディオデータを再生するステップと、
    を含み、
    前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットと間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである、多チャネルオーディオデータ再生方法。
  8. 前記多チャネルオーディオデータ再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有する、請求項7に記載の多チャネルオーディオデータ再生方法。
  9. 前記多チャネルオーディオデータフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換する、請求項7に記載の多チャネルオーディオデータ再生方法。
  10. 前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される、請求項7に記載の多チャネルオーディオデータ再生方法。
JP2020018862A 2014-09-24 2020-02-06 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体 Active JP6912612B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021113487A JP7166398B2 (ja) 2014-09-24 2021-07-08 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20140127751 2014-09-24
KR10-2014-0127751 2014-09-24
KR1020150059445A KR101993348B1 (ko) 2014-09-24 2015-04-28 동적 포맷 변환을 지원하는 오디오 메타데이터 제공 장치 및 오디오 데이터 재생 장치, 상기 장치가 수행하는 방법 그리고 상기 동적 포맷 변환들이 기록된 컴퓨터에서 판독 가능한 기록매체
KR10-2015-0059445 2015-04-28
JP2015183123A JP6663147B2 (ja) 2014-09-24 2015-09-16 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015183123A Division JP6663147B2 (ja) 2014-09-24 2015-09-16 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021113487A Division JP7166398B2 (ja) 2014-09-24 2021-07-08 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2020092439A JP2020092439A (ja) 2020-06-11
JP6912612B2 true JP6912612B2 (ja) 2021-08-04

Family

ID=55799280

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015183123A Active JP6663147B2 (ja) 2014-09-24 2015-09-16 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体
JP2020018862A Active JP6912612B2 (ja) 2014-09-24 2020-02-06 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体
JP2021113487A Active JP7166398B2 (ja) 2014-09-24 2021-07-08 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015183123A Active JP6663147B2 (ja) 2014-09-24 2015-09-16 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021113487A Active JP7166398B2 (ja) 2014-09-24 2021-07-08 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体

Country Status (2)

Country Link
JP (3) JP6663147B2 (ja)
KR (5) KR101993348B1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117395593A (zh) 2017-10-04 2024-01-12 弗劳恩霍夫应用研究促进协会 用于编码、解码、场景处理和与基于DirAC的空间音频编码有关的其它过程的装置、方法和计算机程序
KR102062260B1 (ko) * 2017-11-23 2020-01-03 구본희 귀 개방형 헤드폰을 이용한 다채널 사운드 구현 장치 및 그 방법
WO2024062757A1 (ja) * 2022-09-21 2024-03-28 ヤマハ株式会社 情報処理装置、情報処理システムおよび情報処理方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06165079A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd マルチチャンネルステレオ用ダウンミキシング装置
CN102117617B (zh) * 2004-10-28 2013-01-30 Dts(英属维尔京群岛)有限公司 音频空间环境引擎
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US9014377B2 (en) * 2006-05-17 2015-04-21 Creative Technology Ltd Multichannel surround format conversion and generalized upmix
JP2008288935A (ja) * 2007-05-18 2008-11-27 Panasonic Corp 音声処理装置
CN102007533B (zh) * 2008-04-16 2012-12-12 Lg电子株式会社 用于处理音频信号的方法和装置
KR101061128B1 (ko) * 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
JP5417227B2 (ja) * 2010-03-12 2014-02-12 日本放送協会 マルチチャンネル音響信号のダウンミックス装置及びプログラム
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
EP2862370B1 (en) * 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems

Also Published As

Publication number Publication date
JP2021170798A (ja) 2021-10-28
KR20190076934A (ko) 2019-07-02
JP2020092439A (ja) 2020-06-11
KR20220044457A (ko) 2022-04-08
JP6663147B2 (ja) 2020-03-11
KR20210033963A (ko) 2021-03-29
JP2016072973A (ja) 2016-05-09
KR102533824B1 (ko) 2023-05-26
KR102231750B1 (ko) 2021-03-25
JP7166398B2 (ja) 2022-11-07
KR20230071107A (ko) 2023-05-23
KR20160035963A (ko) 2016-04-01
KR101993348B1 (ko) 2019-06-26
KR102380279B1 (ko) 2022-03-30

Similar Documents

Publication Publication Date Title
JP7166398B2 (ja) 動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体
US11671780B2 (en) Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
KR100739723B1 (ko) 오디오 썸네일 기능을 지원하는 오디오 재생 방법 및 장치
BR112015019049B1 (pt) Sinalização de informação de criação de áudio em uma sequência de bits
JP6407155B2 (ja) オーディオデータ生成装置及びオーディオデータ再生装置
JP2012147461A (ja) 多重オーディオチャンネル群の再現の向上
KR102049602B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
KR102455549B1 (ko) 사용자 및 스피커의 위치를 이용한 오디오 신호 변환 장치 및 그 방법
CN106303686A (zh) 视频生成方法、视频生成装置和终端设备
JP5552764B2 (ja) 信号処理装置、およびプログラム
KR102631005B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
KR102217997B1 (ko) 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
EP1905035B1 (en) Audio reproduction method and apparatus supporting audio thumbnail function
KR101454343B1 (ko) 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
JP2018121310A (ja) 音声処理装置、音声出力装置、テレビジョン受像機、音声処理方法、プログラム、及び、プログラムの記録媒体
KR20110102719A (ko) 오디오 업믹싱 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210708

R150 Certificate of patent or registration of utility model

Ref document number: 6912612

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250