WO2014192602A1 - 符号化装置および方法、復号装置および方法、並びにプログラム - Google Patents
符号化装置および方法、復号装置および方法、並びにプログラム Download PDFInfo
- Publication number
- WO2014192602A1 WO2014192602A1 PCT/JP2014/063409 JP2014063409W WO2014192602A1 WO 2014192602 A1 WO2014192602 A1 WO 2014192602A1 JP 2014063409 W JP2014063409 W JP 2014063409W WO 2014192602 A1 WO2014192602 A1 WO 2014192602A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- encoding
- position information
- mode
- information
- encoding mode
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Abstract
Description
〈オーディオシステムの構成例〉
本技術は、音源の位置を示す情報など、音源に関する情報であるメタデータのデータ量を圧縮するための符号化および復号に関するものである。図1は、本技術を適用したオーディオシステムの一実施の形態の構成例を示す図である。
まずメタデータについて説明する。
(D1)オブジェクトを示すインデックス
(D2)オブジェクトの水平方向角度θ
(D3)オブジェクトの垂直方向角度γ
(D4)オブジェクトから視聴者までの距離r
(D5)オブジェクトの音声のゲインg
次に、上述したメタデータの符号化について説明する。
(E2)量子化された位置情報およびゲインを、さらに符号化モードに応じて圧縮する
(F2)運動パターン予測モード
(F3)残差モード
続いて、メタデータの符号化時における1段階目の処理と2段階目の処理について、より詳細に説明する。
次に、2段階目の符号化処理について説明する。
以上においては、符号化モードによる符号化によって得られた位置情報やゲイン、差分(残差)などのデータが符号化された位置情報またはゲインとされ、符号化された位置情報やゲインと符号化モード情報とがビットストリームに記述されると説明した。
(G2)符号化モードに変更があった位置情報またはゲインのみ符号化モード情報を記述する
次に、メタデータを符号化する符号化装置であるメタデータエンコーダ22の具体的な実施の形態について説明する。
続いて、図4のメタデータエンコーダ22の動作について説明する。
次に、図6のフローチャートを参照して、図5のステップS15の処理に対応する運動パターン予測モードによる符号化処理について説明する。
続いて、図7のフローチャートを参照して、図5のステップS16の処理に対応する残差モードによる符号化処理について説明する。なお、この処理では、処理対象とされているオブジェクトの水平方向角度θ、垂直方向角度γ、およびゲインgのそれぞれが処理対象とされ、それらの処理対象ごとに処理が行なわれる。
さらに、図8のフローチャートを参照して、図5のステップS18の処理に対応する符号化モード情報圧縮処理について説明する。
ところで、メタデータエンコーダ22において図5を参照して説明した符号化処理が繰り返し行なわれている間には、1フレーム分の符号化処理が行なわれた直後に、または符号化処理とほぼ同時に選択運動パターン予測モードを入れ替える入れ替え処理が行なわれる。
続いて、メタデータエンコーダ22から出力されたビットストリームを受信して、符号化メタデータを復号する復号装置であるメタデータデコーダ32について説明する。
次に、メタデータデコーダ32の動作について説明する。
〈メタデータエンコーダの構成例〉
なお、以上においては、量子化のステップサイズRなどにより定まる量子化ビット数や、差分と比較する閾値として用いられるビット数Mを予め定めておく場合について説明した。しかし、これらのビット数はオブジェクトの位置やゲイン、オーディオデータの特徴、または符号化されたメタデータとオーディオデータの情報を含めたビットストリームのビットレートなどに応じて動的に変更されるようにしてもよい。
次に、図13のフローチャートを参照して、図12に示したメタデータエンコーダ22により行なわれる符号化処理について説明する。
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化する符号化部と、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定する決定部と、
前記決定部により決定された前記符号化モードを示す符号化モード情報と、前記決定部により決定された前記符号化モードにより符号化された前記位置情報とを出力する出力部と
を備える符号化装置。
[2]
前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
[1]に記載の符号化装置。
[3]
前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
[1]または[2]に記載の符号化装置。
[4]
前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
[2]に記載の符号化装置。
[5]
前記出力部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化モード情報を出力しない
[1]乃至[4]の何れかに記載の符号化装置。
[6]
前記出力部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、全ての前記符号化モード情報のうち、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報のみを出力する
[1]乃至[5]の何れかに記載の符号化装置。
[7]
前記位置情報を所定の量子化幅で量子化する量子化部と、
前記音源のオーディオデータの特徴量に基づいて、前記量子化幅を決定する圧縮率決定部と
をさらに備え、
前記符号化部は、量子化された前記位置情報を符号化する
[1]乃至[6]の何れかに記載の符号化装置。
[8]
過去に出力した前記符号化モード情報および前記符号化された前記位置情報のデータ量に基づいて、前記位置情報を符号化する前記符号化モードの入れ替えを行なう切替部をさらに備える
[1]乃至[7]の何れかに記載の符号化装置。
[9]
前記符号化部は、前記音源のゲインをさらに符号化し、
前記出力部は、前記ゲインの前記符号化モード情報と、符号化された前記ゲインとをさらに出力する
[1]乃至[8]の何れかに記載の符号化装置。
[10]
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む符号化方法。
[11]
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む処理をコンピュータに実行させるプログラム。
[12]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得する取得部と、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する復号部と
を備える復号装置。
[13]
前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
[12]に記載の復号装置。
[14]
前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
[12]または[13]に記載の復号装置。
[15]
前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
[13]に記載の復号装置。
[16]
前記取得部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化された前記位置情報のみを取得する
[12]乃至[15]の何れかに記載の復号装置。
[17]
前記取得部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、前記符号化された前記位置情報と、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報とを取得する
[12]乃至[16]の何れかに記載の復号装置。
[18]
前記取得部は、前記音源のオーディオデータの特徴量に基づいて決定された、前記位置情報の符号化時に前記位置情報を量子化した量子化幅を示す情報をさらに取得する
[12]乃至[17]の何れかに記載の復号装置。
[19]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む復号方法。
[20]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む処理をコンピュータに実行させるプログラム。
Claims (20)
- 所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化する符号化部と、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定する決定部と、
前記決定部により決定された前記符号化モードを示す符号化モード情報と、前記決定部により決定された前記符号化モードにより符号化された前記位置情報とを出力する出力部と
を備える符号化装置。 - 前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
請求項1に記載の符号化装置。 - 前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
請求項2に記載の符号化装置。 - 前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
請求項2に記載の符号化装置。 - 前記出力部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化モード情報を出力しない
請求項2に記載の符号化装置。 - 前記出力部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、全ての前記符号化モード情報のうち、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報のみを出力する
請求項2に記載の符号化装置。 - 前記位置情報を所定の量子化幅で量子化する量子化部と、
前記音源のオーディオデータの特徴量に基づいて、前記量子化幅を決定する圧縮率決定部と
をさらに備え、
前記符号化部は、量子化された前記位置情報を符号化する
請求項2に記載の符号化装置。 - 過去に出力した前記符号化モード情報および前記符号化された前記位置情報のデータ量に基づいて、前記位置情報を符号化する前記符号化モードの入れ替えを行なう切替部をさらに備える
請求項2に記載の符号化装置。 - 前記符号化部は、前記音源のゲインをさらに符号化し、
前記出力部は、前記ゲインの前記符号化モード情報と、符号化された前記ゲインとをさらに出力する
請求項2に記載の符号化装置。 - 所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む符号化方法。 - 所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む処理をコンピュータに実行させるプログラム。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得する取得部と、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する復号部と
を備える復号装置。 - 前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
請求項12に記載の復号装置。 - 前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
請求項13に記載の復号装置。 - 前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
請求項13に記載の復号装置。 - 前記取得部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化された前記位置情報のみを取得する
請求項13に記載の復号装置。 - 前記取得部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、前記符号化された前記位置情報と、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報とを取得する
請求項13に記載の復号装置。 - 前記取得部は、前記音源のオーディオデータの特徴量に基づいて決定された、前記位置情報の符号化時に前記位置情報を量子化した量子化幅を示す情報をさらに取得する
請求項13に記載の復号装置。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む復号方法。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む処理をコンピュータに実行させるプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/893,909 US9805729B2 (en) | 2013-05-31 | 2014-05-21 | Encoding device and method, decoding device and method, and program |
JP2015519803A JP6380389B2 (ja) | 2013-05-31 | 2014-05-21 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP14803533.0A EP3007168A4 (en) | 2013-05-31 | 2014-05-21 | Encoding device and method, decoding device and method, and program |
CN201480029798.0A CN105229734B (zh) | 2013-05-31 | 2014-05-21 | 编码装置和方法、解码装置和方法以及计算机可读介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013115724 | 2013-05-31 | ||
JP2013-115724 | 2013-05-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014192602A1 true WO2014192602A1 (ja) | 2014-12-04 |
Family
ID=51988635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2014/063409 WO2014192602A1 (ja) | 2013-05-31 | 2014-05-21 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9805729B2 (ja) |
EP (1) | EP3007168A4 (ja) |
JP (1) | JP6380389B2 (ja) |
CN (1) | CN105229734B (ja) |
TW (1) | TWI615834B (ja) |
WO (1) | WO2014192602A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019198540A1 (ja) * | 2018-04-12 | 2019-10-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2021503628A (ja) * | 2017-11-17 | 2021-02-12 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
JP2021517668A (ja) * | 2018-04-10 | 2021-07-26 | ガウディオ・ラボ・インコーポレイテッド | メタデータを利用するオーディオ信号処理方法及び装置 |
JP7485109B2 (ja) | 2018-04-12 | 2024-05-16 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3657823A1 (en) * | 2013-11-28 | 2020-05-27 | Dolby Laboratories Licensing Corporation | Position-based gain adjustment of object-based audio and ring-based channel audio |
CN106774930A (zh) * | 2016-12-30 | 2017-05-31 | 中兴通讯股份有限公司 | 一种数据处理方法、装置及采集设备 |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
KR20200128023A (ko) * | 2018-03-15 | 2020-11-11 | 소니 주식회사 | 화상 처리 장치 및 방법 |
GB2582916A (en) * | 2019-04-05 | 2020-10-14 | Nokia Technologies Oy | Spatial audio representation and associated rendering |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
US20220383881A1 (en) * | 2021-05-27 | 2022-12-01 | Qualcomm Incorporated | Audio encoding based on link data |
CN117581566A (zh) * | 2022-05-05 | 2024-02-20 | 北京小米移动软件有限公司 | 音频处理方法、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009522610A (ja) * | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | バイノーラルオーディオ信号の復号制御 |
JP2009526467A (ja) * | 2006-02-09 | 2009-07-16 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置 |
JP2009543389A (ja) * | 2006-07-08 | 2009-12-03 | ノキア コーポレイション | バイノーラル音響信号の動的な復号 |
JP2010515099A (ja) * | 2006-12-27 | 2010-05-06 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法 |
JP2010521002A (ja) * | 2006-09-29 | 2010-06-17 | 韓國電子通信研究院 | 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 |
WO2010109918A1 (ja) * | 2009-03-26 | 2010-09-30 | パナソニック株式会社 | 復号化装置、符号化復号化装置および復号化方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
KR20090110242A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
US9165558B2 (en) * | 2011-03-09 | 2015-10-20 | Dts Llc | System for dynamically creating and rendering audio objects |
TW202339510A (zh) * | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
AU2012279349B2 (en) * | 2011-07-01 | 2016-02-18 | Dolby Laboratories Licensing Corporation | System and tools for enhanced 3D audio authoring and rendering |
-
2014
- 2014-05-20 TW TW103117629A patent/TWI615834B/zh not_active IP Right Cessation
- 2014-05-21 CN CN201480029798.0A patent/CN105229734B/zh active Active
- 2014-05-21 EP EP14803533.0A patent/EP3007168A4/en not_active Ceased
- 2014-05-21 JP JP2015519803A patent/JP6380389B2/ja not_active Expired - Fee Related
- 2014-05-21 US US14/893,909 patent/US9805729B2/en active Active
- 2014-05-21 WO PCT/JP2014/063409 patent/WO2014192602A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009522610A (ja) * | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | バイノーラルオーディオ信号の復号制御 |
JP2009526467A (ja) * | 2006-02-09 | 2009-07-16 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置 |
JP2009543389A (ja) * | 2006-07-08 | 2009-12-03 | ノキア コーポレイション | バイノーラル音響信号の動的な復号 |
JP2010521002A (ja) * | 2006-09-29 | 2010-06-17 | 韓國電子通信研究院 | 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 |
JP2010515099A (ja) * | 2006-12-27 | 2010-05-06 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法 |
WO2010109918A1 (ja) * | 2009-03-26 | 2010-09-30 | パナソニック株式会社 | 復号化装置、符号化復号化装置および復号化方法 |
Non-Patent Citations (3)
Title |
---|
See also references of EP3007168A4 * |
VILLE PULKKI: "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", JOURNAL OF AES, vol. 45, no. 6, 1 June 1997 (1997-06-01), pages 456 - 466, XP000695381 * |
VILLE PULKKI: "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", JOURNAL OF AES, vol. 45, no. 6, 1997, pages 456 - 466 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7175980B2 (ja) | 2017-11-17 | 2022-11-21 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
US11367454B2 (en) | 2017-11-17 | 2022-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
JP2021503628A (ja) * | 2017-11-17 | 2021-02-12 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
JP2022058577A (ja) * | 2017-11-17 | 2022-04-12 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
JP7372360B2 (ja) | 2017-11-17 | 2023-10-31 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
US11783843B2 (en) | 2017-11-17 | 2023-10-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions |
JP7371968B2 (ja) | 2018-04-10 | 2023-10-31 | ガウディオ・ラボ・インコーポレイテッド | メタデータを利用するオーディオ信号処理方法及び装置 |
US11950080B2 (en) | 2018-04-10 | 2024-04-02 | Gaudio Lab, Inc. | Method and device for processing audio signal, using metadata |
JP2021517668A (ja) * | 2018-04-10 | 2021-07-26 | ガウディオ・ラボ・インコーポレイテッド | メタデータを利用するオーディオ信号処理方法及び装置 |
JP2022126849A (ja) * | 2018-04-10 | 2022-08-30 | ガウディオ・ラボ・インコーポレイテッド | メタデータを利用するオーディオ信号処理方法及び装置 |
JP7102024B2 (ja) | 2018-04-10 | 2022-07-19 | ガウディオ・ラボ・インコーポレイテッド | メタデータを利用するオーディオ信号処理装置 |
US11540075B2 (en) | 2018-04-10 | 2022-12-27 | Gaudio Lab, Inc. | Method and device for processing audio signal, using metadata |
WO2019198540A1 (ja) * | 2018-04-12 | 2019-10-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP7226436B2 (ja) | 2018-04-12 | 2023-02-21 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
JPWO2019198540A1 (ja) * | 2018-04-12 | 2021-04-22 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP7485109B2 (ja) | 2018-04-12 | 2024-05-16 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
TW201503113A (zh) | 2015-01-16 |
TWI615834B (zh) | 2018-02-21 |
US9805729B2 (en) | 2017-10-31 |
JP6380389B2 (ja) | 2018-08-29 |
EP3007168A4 (en) | 2017-01-25 |
EP3007168A1 (en) | 2016-04-13 |
US20160133261A1 (en) | 2016-05-12 |
CN105229734A (zh) | 2016-01-06 |
JPWO2014192602A1 (ja) | 2017-02-23 |
CN105229734B (zh) | 2019-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6380389B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
US11798568B2 (en) | Methods, apparatus and systems for encoding and decoding of multi-channel ambisonics audio data | |
CN106415714B (zh) | 译码环境高阶立体混响系数的独立帧 | |
US9058803B2 (en) | Multichannel audio stream compression | |
CN101223582B (zh) | 一种音频编码方法、音频解码方法及音频编码器 | |
KR101921403B1 (ko) | 고차 앰비소닉 신호 압축 | |
CN106133828B (zh) | 编码装置和编码方法、解码装置和解码方法及存储介质 | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
CN105580072A (zh) | 用于声场的空间分量的压缩的量化步长 | |
US20210176582A1 (en) | Information processing apparatus and method, and program | |
WO2015146860A1 (ja) | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム | |
CN106471578A (zh) | 较高阶立体混响信号之间的交叉淡化 | |
JP2022509440A (ja) | 空間オーディオパラメータの符号化及び対応する復号の決定 | |
TW201606751A (zh) | 將高階保真立體音響信號表示之次頻帶內主導方向信號之方向編碼/解碼之方法及裝置 | |
KR20200140874A (ko) | 공간 오디오 파라미터의 양자화 | |
CN113129913B (zh) | 音频信号的编解码方法和编解码装置 | |
US9781539B2 (en) | Encoding device and method, decoding device and method, and program | |
CN111179951B (zh) | 包括编码hoa表示的位流的解码方法和装置、以及介质 | |
KR20220018588A (ko) | DirAC 기반 공간 오디오 코딩을 위한 패킷 손실 은닉 | |
Yang et al. | Multi-stage encoding scheme for multiple audio objects using compressed sensing | |
US7747093B2 (en) | Method and apparatus for predicting the size of a compressed signal | |
CN118038882A (en) | Audio encoding method, device, computer readable medium and electronic equipment | |
CN113129910A (zh) | 音频信号的编解码方法和编解码装置 | |
CN118016077A (en) | Decoding method and apparatus comprising a bitstream encoding an HOA representation, and medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 201480029798.0 Country of ref document: CN |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14803533 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2015519803 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2014803533 Country of ref document: EP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 14893909 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |