JP2009514008A - マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 - Google Patents

マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 Download PDF

Info

Publication number
JP2009514008A
JP2009514008A JP2008537589A JP2008537589A JP2009514008A JP 2009514008 A JP2009514008 A JP 2009514008A JP 2008537589 A JP2008537589 A JP 2008537589A JP 2008537589 A JP2008537589 A JP 2008537589A JP 2009514008 A JP2009514008 A JP 2009514008A
Authority
JP
Japan
Prior art keywords
information
configuration information
additional configuration
channel audio
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008537589A
Other languages
English (en)
Other versions
JP2009514008A5 (ja
Inventor
ウォン ジュン,ヤン
スク パン,ヒー
オ オー,ヒェン
スー キム,ドン
ヒュン リム,ジェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009514008A publication Critical patent/JP2009514008A/ja
Publication of JP2009514008A5 publication Critical patent/JP2009514008A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Abstract

本発明は、マルチチャンネルオーディオ信号符号化及び復号化方法とその装置に関するものである。本符号化方法では、マルチチャンネルオーディオ信号とダウンミックス信号に基づいて算出した空間情報を符号化し、符号化された空間情報から選択された付加的構成情報を生成する。そして、ダウンミックス信号を符号化して符号化された空間情報と結合し、付加的構成情報を所定区間に挿入したビットストリームを生成する。本発明によると、ヘッダなどに含まれる情報の一部あるいは全体を再転送して使用環境によって最適のビットストリームを構成することができる。

Description

本発明は、符号化及び復号化方法とその装置に関し、より詳しくは、ヘッダなどに含まれる情報の全部あるいは一部の再転送が可能であるように、マルチチャンネルオーディオ信号を符号化及び復号化する符号化及び復号化方法とその装置に関する。
一般に、マルチチャンネルオーディオ信号符号化方法は、各チャンネル別に信号を全て符号化する代わりに、マルチチャンネルオーディオ信号をモノ信号あるいはステレオ信号にダウンミックスした信号を符号化する方式を使用する。この際、空間キュー(spatial cue)などを表現するための空間情報(spatial information)が付加情報として共に符号化される。
図1は、一般的なマルチチャンネルオーディオ信号符号化方法により生成されるマルチチャンネルオーディオ信号のビットストリームに対する構成を示すものである。図1を参照すると、マルチチャンネルオーディオ信号のビットストリームは、フレーム単位に分割されて転送されるか復号化され、その最初のフレームの前にヘッダ領域が存在する。ヘッダ領域にはSAC(Spatial Audio Coding)構成情報などが含まれ、各フレームには該当フレームに対する空間情報などが含まれる。ヘッダ領域に含まれるSAC構成情報は、各フレームに共通に適用できる内容、即ち、標本化周波数、フレーム長さ、及びマルチチャンネルオーディオ信号がどんな組合によりダウンミックスされているかのような情報を含む。
ところが、SAC構成情報などは、ビットストリームのヘッダ領域に含まれるので、ファイルヘッダのように全ビットストリームで最初の一回だけ含まれる。したがって、ストリーミングサービス(streaming service)のように、始めからマルチチャンネルオーディオ信号のビットストリームの転送を受けられない環境では、復号化に必要とされる必須情報を獲得することが困難になる。
また、マルチチャンネルオーディオ信号が如何なる組合によりダウンミックスされたかを表す情報などもSAC構成情報に一回だけ含まれるので、マルチチャンネルオーディオ信号の全体に対して一つのダウンミックス組合のみを使用することができる。したがって、フレーム別にダウンミックス組合を変更するか、他の構成で復号化できない等、マルチチャンネルオーディオ信号のフレーム毎に最適の効率を有するように符号化あるいは復号化できない。
本発明の目的は、ヘッダなどから選択された情報を付加的構成情報として再転送可能に符号化する符号化方法及びその装置を提供することにある。
本発明の他の目的は、ヘッダなどから選択された付加的構成情報が含まれたビットストリームを復号化する復号化方法及びその装置を提供することにある。
上記の目的を達成するために、本発明に係る符号化方法は、マルチチャンネルオーディオ信号とダウンミックス信号に基づいて算出した空間情報を符号化するステップと、上記符号化された空間情報から選択された付加的構成情報を生成するステップと、上記ダウンミックス信号を符号化して上記符号化された空間情報と結合し、上記付加的構成情報を所定区間に挿入してビットストリームを生成するステップを含む。
また、上記の目的を達成するために、本発明に係る符号化装置は、マルチチャンネルオーディオ信号をダウンミックスしてダウンミックス信号を生成するダウンミックス部、上記ダウンミックス信号を符号化するコアエンコーダ、上記マルチチャンネルオーディオ信号の空間情報を算出する空間情報生成部、上記空間情報を符号化するパラメータエンコーダ、及び上記符号化された空間情報と上記符号化されたダウンミックス信号とを結合し、上記符号化された空間情報から選択された付加構成情報を所定区間に挿入してビットストリームを生成するビットストリーム生成部を含む。
また、本発明に係る復号化方法は、入力を受けたビットストリームのフレームで符号化されたダウンミックス信号と付加情報とを分離するステップと、上記付加情報に含まれた情報に基づいて、付加構成情報が再転送されたか否かを判断するステップと、上記付加構成情報が再転送されていると、抽出した上記付加構成情報を用いて上記フレームに対応するマルチチャンネルオーディオ信号を生成するステップとを含む。
本発明によると、入力を受けたビットストリームのフレームで符号化されたダウンミックス信号と付加情報とを分離するデマルチプレクサと、上記符号化されたダウンミックス信号を復号化してダウンミックス信号を生成するコアデコーダ、上記付加情報に含まれた情報を参照して、付加構成情報が含まれていると、付加情報を復号化して空間情報を生成するパラメータデコーダと、上記空間情報と上記ダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成するマルチチャンネル合成部と、を含む復号化装置が提供される。
また、上記の目的を達成するために、本発明では、上記の方法をプロセッサで実行させるためのプログラムを記録したプロセッサが読取できる記録媒体を提供する。
本発明によると、ヘッダなどに含まれる情報の一部あるいは全部を特定フレームに含めて再転送できるように符号化されるので、ストリーミングサービスの場合などに有用に使用することができる。また、必要によってフレーム毎に異なる構成を有するように符号化及び復号化できるので、使用環境によって最適のビットストリームを生成することができる。
また、選択された空間情報を必要とされるフレームのみに転送できるので、信号の品質を維持し、かつ転送するデータ量を効果的に減少させることができる。
以下、図面を参照しつつ本発明をより詳細に説明する。
本発明に係るマルチチャンネルオーディオ信号符号化及び復号化方法は、基本的にマルチチャンネルオーディオ信号の処理過程に適用されるが、必ずこれに限定されるのではなく、本発明に係る条件を満たす他の信号の処理過程に適用可能である。
図2は、本発明に係る符号化及び復号化方法が適用されるマルチチャンネルオーディオ符号化/復号化装置の一例に対するブロック図である。図2を参照すると、本実施形態に係る符号化装置100は、ダウンミックス部110、空間情報生成部120、コアエンコーダ130、パラメータエンコーダ135、及びビットストリーム生成部140を含む。そして、マルチチャンネルオーディオ復号化装置200は、デマルチプレクサ210、コアデコーダ220、パラメータデコーダ230、及びマルチチャンネル合成部240を含む。
符号化装置100において、ダウンミックス部110はn個のチャンネルで構成されたマルチチャンネルオーディオ信号をモノあるいはステレオ信号にダウンミックス(downmix)してダウンミックス信号を生成する。使用環境によっては外部で加工したアーティステックダウンミックス信号(Artistic Downmix)をダウンミックス信号に使用することもできる。空間情報生成部120はマルチチャンネルオーディオ信号に対する空間情報を算出し、コアエンコーダ130はダウンミックス部110に出力されるダウンミックス信号を符号化して符号化されたダウンミックス信号を生成する。パラメータエンコーダ135は空間情報生成部120で生成した空間情報を符号化する。
ビットストリーム生成部140は符号化されたダウンミックス信号及び空間情報を結合してビットストリームを生成し、必要によってビットストリームの所定区間に付加的構成情報を挿入する。この際、付加的構成情報はヘッダなどに含まれた空間情報やその他の情報の全部あるいは一部に対応する情報である。したがって、空間情報と追加された付加的構成情報は付加情報としてビットストリーム生成部140で生成したビットストリームに含むことができる。
復号化装置200において、デマルチプレクサ210は転送されたビットストリームを受信して符号化されたダウンミックス信号と付加情報とに分離する。コアデコーダ220は符号化されたダウンミックス信号を復号化してダウンミックス信号を生成する。パラメータデコーダ230は付加情報を復号化して空間情報を生成する。この際、付加情報に追加された付加的構成情報が含まれていると、追加された付加的構成情報を用いて空間情報を生成する。マルチチャンネル合成部240は、空間情報とダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成する。
図3及び図4は、本発明で使われる空間情報の構文の一例を示す図である。図3において、「SpatialSpecificConfig()」はヘッダ領域に含まれる空間情報を表し、図4の「SpatialFrame()」は、各フレームに対応する情報であるフレーム情報を表す。
「SpatialSpecificConfig()」はSAC構成情報に対応し、各フレームに共通的に適用できる空間情報を表し、標本化周波数を表す「bsSamplingFrequency」、フレーム長さを表す「bsFrameLength」、マルチチャンネル信号がどんな組合によりダウンミックスされているかを表す「bsTreeConfic」のような情報が含まれている。そして、「SpatialFrame()」はパラメータセットの個数と関連したタイムスロットに対する情報を表す「Fraiminginfo()」のように、各フレームに対応する空間情報が含まれる。
このような情報において、本発明に係る符号化方法では、「SpatialSpecficConfig()」、即ちSAC構成情報に含まれた情報の全部あるいは一部に対応する情報を付加的構成情報として特定フレームあるいは全てのフレーム毎に含めて符号化することができる。したがって、SAC構成情報などがビットストリームのヘッダに一回だけ含まれることでなく、特定フレームあるいは全てのフレーム毎に含まれるように符号化される。
このように、付加的構成情報が所定フレームに挿入されたマルチチャンネルオーディオ信号のビットストリームを復号化するために、次のような方法を使用して符号化する。
まず、「SpatialSpecificConfig()」全体に対応する付加的構成情報を特定フレームに再転送するために、「SpatialFrame()」の中に付加的構成情報が再転送されるか否かを表す再転送フラグを設定する。例えば、この再転送フラグを「bsResendSptialSpecificConficFrame」とすると、復号化過程ではこの再転送フラグがセットされている場合、「SpatialSpecifigConfig()」全体に対応する付加的構成情報が含まれていることが分かる。
また、ヘッダに含まれる「SpatialSpecifigConfig()」の中に再転送フラグを設定することができる。例えば、ヘッダ内に設定される再転送フラグを「bsResendSpatialSpecificConfigHeader」とすると、この再転送フラグがセットされている場合、「SpatialFrame()」の中の再転送フラグ(bsResendSpatialSpecificConficFrame)のセットの可否を再度検査して、これによって、再度付加的構成情報の転送を受けることができる。もし、ヘッダの中に再転送フラグがセットされていないと、付加的構成情報が含まれていないビットストリームであることが分かるので、フレーム内の再転送フラグをチェックする過程無しで復号化過程が進行されることができる。
付加的構成情報を「SpatialSpecificConfig()」全体に対応するように構成する代わりに、その中から選択された特定パラメータだけで構成することができる。特定パラメータセットを「SpatialSpecificConfigParam」とすると、「SpatialFrame()」の中に「SpatialSpecifigConfigParam」が再転送されるかに対するフラグ、例えば、「bsResendSpatialSpecificConficParamFrame」を置いて、この再転送フラグがセットされている場合、「SpatialSpecifigConfigParam」が再度転送されることが分かる。
同様に、ヘッダに含まれる「SpatialSpecifigConfig()」の中に再転送可能フラグ、例えば「bsResendSpatialSpecificConfigParamHeader」を置いて、このフラグがセットされている場合、「SpatialFrame()」で「SpatialSpecificConfigParam」が再転送されるかに対するフラグ(bsResendSpatialSpecificConficParamFrame)を再度チェックして、これによって、再度付加的構成情報の転送を受けることができる。この場合にも、ヘッダ内の再転送フラグがセットされていないと、付加的構成情報が含まれていない一般的なビットストリームであることが分かる。
このような方法によりヘッダなどに含まれる空間情報の全部あるいは一部を周期的に再転送するか、必要によって選択されたフレームに含めて再転送できるように符号化することができる。
一方、ヘッダに含まれる空間情報の一部に対応する「SpatialSpecificConfigParam」を構成するにあたって、「SpatialSpecficConfig()」に含まれた情報のうち、少なくともいずれか一つを含むように構成することができる。
次の[表1]に「SpatialSpecConfig()」に含まれた各変数を定義する。
Figure 2009514008
例えば、マルチチャンネルオーディオ信号がどんな組合によりダウンミックスされたかを表す「bsTreeConfig」を再転送するために、「SpatialFrame」の中に「bsTreeConfig」が再転送されるかに対するフラグ、例えば、「bsResendTreeConfigFrame」を置いて、このフラグがセッティングされている場合、「bsTreeConfig」が再転送されたことが分かる。
また、前述したように、「SpatialSpecifigConfigHeader」の中に再転送可能フラグ、例えば「bsResendTreeConfigHeader」を置いて、このフラグがセットされている場合、「SpatialFrame()」で「bsTreeConfig」が再転送されるかに対するフラグ(bsResendTreeConfigFrame)を再度チェックするようにすることもできる。
このような方法により「bsTreeConfig」を周期的に再転送するか、必要によって選択的に再転送することができ、「bsTreeConfig」をフレーム毎に必要によって異なるように設定する場合、より効率的に信号の格納及び転送が可能になる。
例えば、信号区間によって5つのチャンネルから構成されたマルチチャンネルオーディオ信号がモノ信号で表現されても、その品質が維持される区間とステレオ信号に圧縮されなければならない区間が存在すると、従来の方法は品質維持のために続けてステレオ信号に符号化しなければならないが、本発明によると、必要な区間のみでステレオ信号に符号化することができる。また、同一なモノ信号に符号化する場合にも、信号特性によってモードを変換できるので、同一なビット率でより良い品質の信号が得られる。
そして、「bsTreeConfig」を再転送する代わりに、これを「bsTreeExt」、「bsTreeCh」、「bsTreeCfg」の3ビットに分けて使用することができる。この場合、「bsTreeExt=1」及び「bsTreeConfig=15」であれば、次に拡長されたシグナリングを通じて「TreeDescription」を受け入れる。「bsTreeExt=0」及び「bsTreeCh=0」であれば、515構成フォーマットを利用することができる。「bsTreeExt=1」及び「bsTesCh=1」であれば、525フォーマットを利用することができる。そして、「bsTreeExt=0」、「bsTreeCh=0」及び「bsTreeCfg=0」であれば、5151フォーマットを利用することができる。「bsTreeExt=0」、「bsTreeCh=0」及び「bsTreeCfg=1」であれば、5152フォーマットを利用することができる。このような方法により「bsTreeConfig」を最小2ビットを持って表現できるので、使用ビット数を減少させることができる。
図5及び図6は、本発明の一実施形態に係る復号化方法の説明に提供されるフローチャートである。図5を参照すると、マルチチャンネルオーディオ復号化過程でマルチチャンネルオーディオ信号のヘッダの入力を受けると(S400)、ヘッダ内に設定されている再転送フラグ(bsResendSpatialSpecificConfigHeader)がセットされたか否かを判断する(S405)。判断の結果、ヘッダ内の再転送フラグがセットされていないと、付加的構成情報が含まれていない場合であるので、図6に示すように、ヘッダに含まれた構成情報を空間情報として用いてマルチチャンネルオーディオ信号を生成する(S440乃至S450)。
しかしながら、ヘッダ内の再転送フラグ(bsResendSpatialSpecificConfig Header)がセットされている場合であれば、付加的構成情報が再転送される場合であるので、次のフレームの入力を受けて(S410)、そのフレーム内に含まれた再転送フラグ(bsResendSpatialSpecificConficFrame)がセットされたか否かを判断する(S415)。判断の結果、フレーム内の再転送フラグがセットされていると、付加的構成情報を抽出する(S420)。この際、付加的構成情報は現在のフレームに含まれているか、あるいは以前のフレーム内に存在することができる。
付加的構成情報が抽出されると、抽出された構成情報を用いてダウンミックス信号からマルチチャンネルオーディオ信号を生成する(S425)。即ち、受信したフレームで符号化されたダウンミックス信号とフレーム情報を各々分離し、抽出した付加的構成情報とフレーム情報とを用いて空間情報を生成し、生成した空間情報とダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成する。もし、付加的構成情報がヘッダ内に含まれた空間情報の一部であれば、空間情報の生成に必要な残りの情報はヘッダから抽出した空間情報を用いる。フレーム内の再転送フラグがセットされていないと、ヘッダから抽出した構成情報を用いてマルチチャンネルオーディオ信号を生成する(S435)。このような過程は、ストリーム終了時まで繰り返して遂行される。
図7は、本発明の他の実施形態に係る復号化方法の説明に提供されるフローチャートである。本実施形態の場合には、ヘッダ内に再転送フラグが含まれず、フレーム内のみに再転送フラグが含まれた場合である。図6を参照すると、マルチチャンネルオーディオ信号の復号化装置において、フレームの入力を受けると(S500)、フレーム内の再転送フラグがセットされたか否かを判断する(S505)。判断の結果、再転送フラグがセットされていると、付加的構成情報を抽出する(S510)。抽出した付加的構成情報を用いてマルチチャンネルオーディオ信号を生成する(S515)。即ち、付加的構成情報とフレーム内の情報とを用いて空間情報を生成し、生成した空間情報とダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成する。
これと異なり、再転送フラグがセットされていないと、ヘッダから抽出した構成情報とフレーム情報とを用いて空間情報を生成し、生成した空間情報とダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成する(S525)。
このような方法により、選択されたフレーム内の付加的構成情報を挿入して、ストリーミングサービスのように始めからビットストリームを受信できない場合にも、マルチチャンネルオーディオ信号を生成することができる。
一方、本発明はまたプロセッサが読取可能な記録媒体にプロセッサが読取可能なコードとして具現化することが可能である。プロセッサが読取可能な記録媒体は、プロセッサが設置されたシステムにより読取られることができるデータが格納される全ての種類の記録装置を含む。プロセッサが読取可能な記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ格納装置などがあり、またインターネットを通じた転送のようなキャリアウェーブの形態で具現化されることも含む。また、プロセッサが読取可能な記録媒体はネットワークにより連結されたコンピュータシステムに分散されて、分散方式によりプロセッサが読取可能なコードが格納され、実行されることができる。
また、以上では、本発明の好ましい実施形態に対して図示及び説明したが、本発明は前述した特定の実施形態に限定されず、請求範囲で請求する本発明の要旨を逸脱することなく、当該発明が属する技術分野で通常の知識を有する者により多様な変形実施が可能であることは勿論であり、このような変形実施は本発明の技術的思想や展望から個別的に理解されてはならない。
本発明は、マルチチャンネルオーディオ信号の符号化及び復号化過程などに使われて、ヘッダなどに含まれる情報の全部あるいは一部を再転送することができる。
一般的なマルチチャンネルオーディオ信号のビットストリーム構成を示す図である。 本発明に係る符号化及び復号化方法が適用されるマルチチャンネルオーディオ符号化/復号化装置の一例に対するブロック図である。 本発明で使われる空間情報の構文の一例を示す図である。 本発明で使われる空間情報の構文の一例を示す図である。 本発明の一実施形態に係る復号化方法の説明に提供されるフローチャートである。 本発明の一実施形態に係る復号化方法の説明に提供されるフローチャートである。 本発明の他の実施形態に係る復号化方法の説明に提供されるフローチャートである。

Claims (20)

  1. マルチチャンネルオーディオ信号とダウンミックス信号に基づいて算出した空間情報を符号化するステップと、
    前記符号化された空間情報から選択された付加的構成情報を生成するステップと、
    前記ダウンミックス信号を符号化して前記符号化された空間情報と結合し、前記付加的構成情報を所定区間に挿入してビットストリームを生成するステップと、
    を有することを特徴とする符号化方法。
  2. 前記所定区間は、フレーム単位に分割される前記ビットストリームのフレーム毎に設定される区間である、請求項1に記載の符号化方法。
  3. 前記所定区間は、フレーム単位に分割される前記ビットストリームから選択されたフレーム内の区間である、請求項1に記載の符号化方法。
  4. 前記ビットストリームに前記付加的構成情報が挿入されたか否かを表す再転送フラグを設定し、前記付加的構成情報の挿入の可否によって前記転送フラグをセッティングするステップをさらに有する請求項1に記載の符号化方法。
  5. 前記付加的構成情報は、前記ビットストリームのヘッダに含まれる構成情報から選択された情報である、請求項1に記載の符号化方法。
  6. 前記付加的構成情報は、SAC構成情報から選択された情報である、請求項1に記載の符号化方法。
  7. マルチチャンネルオーディオ信号に対するダウンミックス信号を生成するダウンミックス部と、
    前記ダウンミックス信号を符号化するコアエンコーダと、
    前記マルチチャンネルオーディオ信号の空間情報を算出する空間情報生成部と、
    前記空間情報を符号化するパラメータエンコーダと、
    前記符号化された空間情報と前記符号化されたダウンミックス信号とを結合し、前記符号化された空間情報から選択された付加的構成情報を所定区間に挿入したビットストリームを生成するビットストリーム生成部と、
    を有することを特徴とする符号化装置。
  8. 前記所定区間は、フレーム単位に分割される前記ビットストリームでフレーム毎に設定される区間である、請求項7に記載のマルチチャンネルオーディオ信号符号化装置。
  9. 前記所定区間は、フレーム単位に分割される前記ビットストリームから選択されたフレーム内の区間である、請求項7に記載の符号化装置。
  10. 前記ビットストリーム生成部は、前記ビットストリームに前記付加的構成情報が挿入されたか否かを表す再転送フラグを設定し、前記付加的構成情報の挿入の可否によって前記再転送フラグをセッティングする、請求項7に記載の符号化装置。
  11. 入力を受けたビットストリームのフレームで符号化されたダウンミックス信号と付加情報とを分離するステップと、
    前記付加情報に含まれた情報に基づいて、付加的構成情報が再転送されたか否かを判断するステップと、
    前記付加的構成情報が再転送されると決定された場合、抽出した前記付加構成情報を用いて前記フレームに対応するマルチチャンネルオーディオ信号を生成するステップと、
    を有することを特徴とする復号化方法。
  12. 前記付加的構成情報が再転送されないと決定された場合、前記ビットストリームのヘッダから抽出した空間情報を用いて、前記フレームに対応するマルチチャンネルオーディオ信号を生成するステップをさらに有することを特徴とする請求項11に記載の復号化方法。
  13. 前記付加的構成情報は、前記フレーム及び前記フレームの以前フレームのうち、いずれか一つに含まれている、請求項11に記載の復号化方法。
  14. 前記判断するステップでは、前記付加情報に含まれた再転送情報フラグのセッティングの可否によって、前記付加的構成情報の再転送の可否を判断する、請求項11に記載の復号化方法。
  15. 前記マルチチャンネルオーディオ信号を生成するステップは、
    前記符号化されたダウンミックス信号を復号化してダウンミックス信号を生成するステップと、
    前記付加的構成情報を用いて空間情報を生成し、前記空間情報と前記ダウンミックス信号とを用いて前記マルチチャンネルオーディオ信号を生成するステップと、
    を有する請求項11に記載の復号化方法。
  16. 前記付加的構成情報は、前記ビットストリームのヘッダに含まれる構成情報から選択された情報である、請求項11に記載の復号化方法。
  17. 入力を受けたビットストリームのフレームで符号化されたダウンミックス信号と付加情報とを各々分離するデマルチプレクサと、
    前記符号化されたダウンミックス信号を復号化してダウンミックス信号を生成するコアデコーダと、
    前記付加情報に含まれた情報を参照して付加的構成情報が再転送されたか否かを判断して、前記付加的構成情報が再転送されると決定された場合、前記付加的構成情報を復号化して空間情報を生成するパラメータデコーダと、
    前記空間情報と前記ダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成するマルチチャンネル合成部と、
    を有することを特徴とする復号化装置。
  18. 前記パラメータデコーダは、前記付加的構成情報が再転送されないと決定された場合、前記ビットストリームのヘッダから抽出した構成情報を復号化して前記空間情報を生成する、請求項17に記載のマルチチャンネルオーディオ信号復号化装置。
  19. マルチチャンネルオーディオ信号とダウンミックス信号に基づいて算出した空間情報を符号化するステップと、
    前記符号化された空間情報から選択された付加的構成情報を生成するステップと、
    前記ダウンミックス信号を符号化して前記符号化された空間情報と結合し、前記付加的構成情報を所定区間に挿入してビットストリームを生成するステップと、
    を有する符号化方法をプロセッサで実行させるためのプログラムを記録したプロセッサが読取可能な記録媒体。
  20. 入力を受けたビットストリームのフレームで符号化されたダウンミックス信号と付加情報とを分離するステップと、
    前記付加情報に含まれた情報に基づいて、付加的構成情報が再転送されたか否かを判断するステップと、
    前記付加的構成情報が再転送されていると、抽出した前記付加構成情報を用いて前記フレームに対応するマルチチャンネルオーディオ信号を生成するステップと、
    を有する復号化方法をプロセッサで実行させるためのプログラムを記録したプロセッサが読取可能な記録媒体。
JP2008537589A 2005-10-26 2006-10-20 マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 Pending JP2009514008A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US73003305P 2005-10-26 2005-10-26
KR20060071754 2006-07-28
PCT/KR2006/004286 WO2007049881A1 (en) 2005-10-26 2006-10-20 Method for encoding and decoding multi-channel audio signal and apparatus thereof

Publications (2)

Publication Number Publication Date
JP2009514008A true JP2009514008A (ja) 2009-04-02
JP2009514008A5 JP2009514008A5 (ja) 2009-12-10

Family

ID=37967960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008537589A Pending JP2009514008A (ja) 2005-10-26 2006-10-20 マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置

Country Status (7)

Country Link
US (1) US8238561B2 (ja)
EP (1) EP1946310A4 (ja)
JP (1) JP2009514008A (ja)
KR (2) KR20080094710A (ja)
CN (1) CN101297353B (ja)
TW (2) TWI323878B (ja)
WO (1) WO2007049881A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
JP5340261B2 (ja) * 2008-03-19 2013-11-13 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101061128B1 (ko) 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
US8326446B2 (en) 2008-04-16 2012-12-04 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2009128663A2 (en) 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US9031850B2 (en) * 2009-08-20 2015-05-12 Gvbb Holdings S.A.R.L. Audio stream combining apparatus, method and program
JP2011177430A (ja) * 2010-03-03 2011-09-15 Terumo Corp 医療用マニピュレータシステム
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
KR101427756B1 (ko) * 2013-04-26 2014-08-08 주식회사 코아로직 멀티 채널의 오디오 신호 전송 방법 및 장치
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
PL3522155T3 (pl) * 2015-05-20 2021-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Kodowanie wielokanałowych sygnałów audio
EP3869825A1 (en) 2015-06-17 2021-08-25 Samsung Electronics Co., Ltd. Device and method for processing internal channel for low complexity format conversion
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
ATE255785T1 (de) * 1999-04-07 2003-12-15 Dolby Lab Licensing Corp Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen
JP3529665B2 (ja) * 1999-04-16 2004-05-24 パイオニア株式会社 情報変換方法及び情報変換装置並びに情報再生装置
JP2004518164A (ja) * 2001-01-16 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
ES2300567T3 (es) * 2002-04-22 2008-06-16 Koninklijke Philips Electronics N.V. Representacion parametrica de audio espacial.
RU2325046C2 (ru) * 2002-07-16 2008-05-20 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7830921B2 (en) * 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals

Also Published As

Publication number Publication date
TWI451401B (zh) 2014-09-01
TW200746045A (en) 2007-12-16
TW200939205A (en) 2009-09-16
EP1946310A1 (en) 2008-07-23
US8238561B2 (en) 2012-08-07
CN101297353B (zh) 2013-03-13
EP1946310A4 (en) 2011-03-09
KR20080065293A (ko) 2008-07-11
KR20080094710A (ko) 2008-10-23
US20080262854A1 (en) 2008-10-23
CN101297353A (zh) 2008-10-29
WO2007049881A1 (en) 2007-05-03
KR100891688B1 (ko) 2009-04-03
TWI323878B (en) 2010-04-21

Similar Documents

Publication Publication Date Title
JP2009514008A (ja) マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
JP2009514008A5 (ja)
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
JP5006315B2 (ja) オーディオ信号のエンコーディング及びデコーディング方法及び装置
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
TWI517142B (zh) Audio decoding apparatus and method, audio coding apparatus and method, and program
US9966080B2 (en) Audio object encoding and decoding
JP5118022B2 (ja) オーディオ信号の符号化/復号化方法及び符号化/復号化装置
JP5507844B2 (ja) マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
JP2010521013A (ja) オーディオ信号の処理方法及び装置
TW201013638A (en) Method and apparatus for processing a audio signal
JP4568363B2 (ja) オーディオ信号デコーディング方法及びその装置
CN101292428B (zh) 用于编码/解码的方法和装置
EP2815399A1 (en) A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
JP4859925B2 (ja) オーディオ信号デコーディング方法及びその装置
US20050141722A1 (en) Signal processing
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
TW200939865A (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
TWI333641B (en) Method and apparatus for encoding and decoding an audio signal
KR20070041338A (ko) 오디오 코덱의 디코딩 및 인코딩 방법 및 장치

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20091020

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121113