JP2014010335A - オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 - Google Patents
オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 Download PDFInfo
- Publication number
- JP2014010335A JP2014010335A JP2012147500A JP2012147500A JP2014010335A JP 2014010335 A JP2014010335 A JP 2014010335A JP 2012147500 A JP2012147500 A JP 2012147500A JP 2012147500 A JP2012147500 A JP 2012147500A JP 2014010335 A JP2014010335 A JP 2014010335A
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- signal
- channel
- encoding
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 57
- 238000004590 computer program Methods 0.000 title claims description 8
- 238000006243 chemical reaction Methods 0.000 claims abstract description 65
- 230000005236 sound signal Effects 0.000 claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 238000000926 separation method Methods 0.000 claims description 14
- 230000001629 suppression Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 35
- 238000013139 quantization Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】オーディオ符号化装置1は、オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出する算出部13を有する。更に、当該オーディオ符号化装置1は、第1チャネル信号と第2チャネル信号とを用いて複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、第1チャネル信号を用いて第2チャネル信号を予測する第2の予測符号化の何れかを、第1の位相に基づいて行う予測符号化部15を有する。オーディオ復号装置は、選択情報に基づいて、第1チャネル信号、第2チャネル信号ならびに第3チャネル信号をマトリクス変換するマトリクス変換部を有する。
【選択図】図1
Description
図1は、一つの実施形態によるオーディオ符号化装置1の機能ブロックを示す図である。図1に示す様に、オーディオ符号化装置1は,時間周波数変換部11、第1ダウンミックス部12、算出部13、第2ダウンミックス部14、予測符号化部15、チャネル信号符号化部16、空間情報符号化部20、多重化部21を有する。また、チャネル信号符号化部16は、SBR符号化部17と、周波数時間変換部18と、AAC符号化部19を含んでいる。
(数1)
ここでnは時間を表す変数であり、1フレームのオーディオ信号を時間方向に128等分したときのn番目の時間を表す。なお,フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。またQMF(k,n)は、時間n、周波数kの周波数信号を出力するためのQMFである。時間周波数変換部11は、QMF(k,n)を入力されたチャネルの1フレーム分のオーディオ信号に乗じることにより、そのチャネルの周波数信号を生成する。なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号をそれぞれ周波数信号に変換してもよい。
(数2)
(数3)
(数4)
(数5)
(数6)
ここで、eR(k)は、右前方チャネルの周波数信号R(k,n)の自己相関値であり、eSR(k)は、右後方チャネルの周波数信号SR(k,n)の自己相関値である。またeRSR(k)は、右前方チャネルの周波数信号R(k,n)と右後方チャネルの周波数信号SR(k,n)との相互相関値である。
(数8)
(数9)
この時、上述の(数9)において、
と置換すると、第1の位相に相当するcosθ1は、次式で算出することが可能となる。
(数10)
ここで、cosθ1の値が−1の場合は、第1の位相は逆位相となり、cosθ1の値が1の場合は、第1の位相は同位相となる。なお、第2の位相についても第1の位相と同様に算出することが可能である為、詳細な説明は省略する。
(数11)
(数12)
(数13)
(数14)
(数15)
(数16)
ここでIQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。なお、時間周波数変換部11が、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いている場合、周波数時間変換部18は、その時間周波数変換処理の逆変換を使用する。周波数時間変換部18は、各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルのステレオ信号をAAC符号化部19へ出力する。
図1の予測符号化部15は、第2の予測符号化を行う場合、左側周波数信号L0(k,n)と、右側周波数信号R0(k,n)の双方を用いて、左側周波数信号L0(k,n)と、右側周波数信号R0(k,n)の何れかを予測符号化を行っても良い。例えば、右側周波数信号R0(k,n)の予測符号化を行う場合、予測符号化後の右側周波数信号R’0(k,n)を、次式で表現することができる。
(数17)
この場合、予測符号化部15は、上述の(数17)において、誤差d(k)が最も小さくなる予測係数c1(k)と、c2(k)の予測係数となる0を選択する。なお、左周波数信号L0(k,n)の予測符号化を行う場合や、第1の位相と第2の位相が同位相または逆位相の場合における中央チャネルの信号C0(k,n)の予測符号化を行う場合についても同様の方法で行うことが可能である為、詳細な説明は省略する。
図3(b)において、左側周波数信号L0(k,n)のベクトルと、右側周波数信号R0(k,n)のベクトルの余弦関数cosθ1が、180°となっており、第1の位相が逆位相になっていることを示しているが、算出部13は180°に対して所定の角度をマージンとして付与して逆位相と規定も良い。例えばマージンを±5°と設定して、175°〜185°の範囲を逆位相として擬似的に判定しても良い。この場合、例えば、右側周波数信号R0(k,n)の予測符号化を行う場合、予測符号化後の右側周波数信号R0(k,n)は次式で表現することができる。
(数18)
これは、符号帳に含まれる予測係数は、図2に示す様に、有限の個数である故に、図3(a)ないし図3(c)に示すベクトルの合成に用いる係数も限られている為である。換言すると、オーディオ符号化においては、上述の(数12)で算出される誤差よりも、(数18)で算出される誤差が小さくなる場合も想定され得る為である。なお、マージンの角度は、例えば、オーディオ符号化装置1が生成する右側周波数信号R0(k,n)と左側周波数信号L0(k,n)をベクトルで表現した場合において、当該ベクトルの平均的な大きさや方位と、符号帳に含まれる予測係数、ならびに誤差d(k)等をパラメータとしたシミュレーション等によって決定することが出来る。なお、左周波数信号L0(k,n)の予測符号化を行う場合や、第1の位相と第2の位相が同位相または逆位相の場合における中央チャネルの信号C0(k,n)の予測符号化を行う場合についても同様の方法で行うことが可能である為、詳細な説明は省略する。また、図3(c)に示すように、第1の位相が同位相の場合も同様にマージンを設定することが可能である。例えばマージンを±5°と設定して、−5°〜5°の範囲を同位相として擬似的に判定しても良い。その他の具体的な手法については上述の逆位相の場合と同様である為、詳細な説明は省略する。
図11は、一つの実施形態によるオーディオ復号装置100の機能ブロックを示す図である。図11に示す様に、オーディオ符号化装置100は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、マトリクス変換部108、アップミックス部111、周波数時間変換部112を含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。マトリクス変換部108は、判定部109、変換部110を含んでいる。
(数19)
ここでQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。
(数20)
なお、予測復号部107は、空間情報復号部106から受け取る予測係数と、チャネル信号復号部102から受け取るステレオ周波数信号から予測復号のみを行えば良く、左側周波数信号L0(k,n)と右側周波数信号R0(k,n)と中央チャネル信号C0(k,n)との何れについて予測復号を実施したかを認識する必要はない。これは、後述する判定部109が選択情報に基づいて認識することが出来る為である。
(数21)
ここで、Lout(k,n)、Rout(k,n)、Cout(k,n)は、それぞれ、左チャネル、右チャネル及び中央チャネルの周波数信号である。マトリックス変換部108は、変換部110でマトリクス変換した、左チャネルの周波数信号Lout(k,n)、右チャネルの周波数信号Rout(k,n)及び、中央チャネルの周波数信号Cout(k,n)をアップミックス部111へ出力する。
図12は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その1)である。図13は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その2)である。図12と図13に示す様に、オーディオ符号化復号システム1000は、時間周波数変換部11、第1ダウンミックス部12、算出部13、第2ダウンミックス部14、予測符号化部15、チャネル信号符号化部16、空間情報符号化部20、多重化部21を有する。また、チャネル信号符号化部16は、SBR符号化部17と、周波数時間変換部18と、AAC符号化部19を含んでいる。また、オーディオ符号化復号システム1000は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、マトリクス変換部108、アップミックス部111、周波数時間変換部112と含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。更に、マトリクス変換部108は、判定部109、変換部110を含んでいる。なお、オーディオ符号化復号システム1000が含む各機能は、図1ならびに図11に示す機能と同様となる為、詳細な説明は省略する。
(付記1)
オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出する算出部と、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行う予測符号化部と、
を備えることを特徴とするオーディオ符号化装置。
(付記2)
前記予測符号化部は、前記第1の位相が同位相または逆位相以外の場合は、前記第1の予測符号化を行い、前記第1の位相が同位相または逆位相の場合は、前記第2の予測符号化を行うことを特徴とする付記1記載のオーディオ符号化装置。
(付記3)
前記予測符号化部は、前記第1の予測符号化または前記第2の予測符号化の何れかで予測符号化を行ったことを示す選択情報を生成することを特徴とする付記1または付記2記載のオーディオ符号化装置。
(付記4)
前記選択情報に基づいて前記第1チャネル信号と前記第2チャネル信号から第1のステレオ周波数信号または、
前記第1チャネル信号と前記第3チャネル信号から第2のステレオ周波数信号の何れかを生成するダウンミックス部を更に備えることを特徴とする付記1ないし付記3の何れか1つに記載のオーディオ符号化装置。
(付記5)
前記算出部は、前記第3チャネル信号と、前記第1チャネル信号または前記第2チャネル信号との位相を示す第2の位相を更に算出し、
前記予測符号化部は、前記第1の位相と前記第2の位相が同位相または逆位相の場合は、前記第1チャネル信号または前記第2チャネル信号の何れかを用いて、前記第3チャネル信号の予測符号化を行うことを特徴とする付記1ないし付記4の何れか1つに記載のオーディオ符号化装置。
(付記6)
前記予測符号化部は、前記第2の予測符号化を、前記第3チャネル信号を更に用いて前記第2チャネル信号を予測することを特徴とする付記1ないし付記5の何れか1つに記載のオーディオ符号化装置。
(付記7)
前記予測符号化部は、符号帳に含まれる複数の予測係数を用いて前記第1の予測符号化または前記第2の予測符号化を行うことを特徴とする付記1ないし付記5の何れか1つに記載のオーディオ符号化装置。
(付記8)
前記予測符号化部は、前記第2の予測符号化を行う場合、
予測符号化後の前記第2チャネル信号と、予測符号化前の前記第2チャネル信号との差分で規定される第1の誤差と、
前記第2チャネル信号を用いて前記第1チャネル信号を予測した予測符号後の前記第1チャネル信号と、予測符号化前の前記第1チャネル信号との差分で規定される第2の誤差と、を算出し、
前記第1の誤差と前記第2の誤差を比較し、前記第1の誤差よりも前記第2の誤差が小さい場合、前記第1チャネル信号を用いて前記第2チャネル信号を予測せずに、前記第2チャネル信号を用いて前記第1チャネル信号を予測することを特徴とする付記1ないし付記4の何れか1つに記載のオーディオ符号化装置。
(付記9)
前記選択情報を多重化する多重化部を更に備えることを特徴とする付記3に記載のオーディオ符号化装置。
(付記10)
オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出すること、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行うことを含むオーディオ符号化方法。
(付記11)
前記予測符号化することは、前記第1の位相が同位相または逆位相以外の場合は、前記第1の予測符号化を行い、前記第1の位相が同位相または逆位相の場合は、前記第2の予測符号化を行うことを特徴とする付記10記載のオーディオ符号化方法。
(付記12)
前記予測符号化することは、前記第1の予測符号化または前記第2の予測符号化の何れかで予測符号化を行ったことを示す選択情報を生成することを特徴とする付記10または付記11記載のオーディオ符号化方法。
(付記13)
前記選択情報に基づいて前記第1チャネル信号と前記第2チャネル信号から第1のステレオ周波数信号または、
前記第1チャネル信号と前記第3チャネル信号から第2のステレオ周波数信号の何れかを生成することを更に行うことを特徴とする付記10ないし付記12の何れか1つに記載のオーディオ符号化装置。
(付記14)
前記算出することは、前記第3チャネル信号と、前記第1チャネル信号または前記第2チャネル信号との位相を示す第2の位相を更に算出し、
前記予測符号化部することは、前記第1の位相と前記第2の位相が同位相または逆位相の場合は、前記第1チャネル信号または前記第2チャネル信号の何れかを用いて、前記第3チャネル信号の予測符号化を行うことを特徴とする付記10ないし付記13の何れか1つに記載のオーディオ符号化方法。
(付記15)
前記予測符号化することは、前記第2の予測符号化を、前記第3チャネル信号を更に用いて前記第2チャネル信号を予測することを特徴とする付記10ないし付記14の何れか1つに記載のオーディオ符号化方法。
(付記16)
前記予測符号化することは、前記第2の予測符号化を行う場合、
予測符号化後の前記第2チャネル信号と、予測符号化前の前記第2チャネル信号との差分で規定される第1の誤差と、
前記第2チャネル信号を用いて前記第1チャネル信号を予測した予測符号後の前記第1チャネル信号と、予測符号化前の前記第1チャネル信号との差分で規定される第2の誤差と、を算出し、
前記第1の誤差と前記第2の誤差を比較し、前記第1の誤差よりも前記第2の誤差が小さい場合、前記第1チャネル信号を用いて前記第2チャネル信号を予測せずに、前記第2チャネル信号を用いて前記第1チャネル信号を予測することを特徴とする付記10ないし付記15の何れか1つに記載のオーディオ符号化方法。
(付記17)
オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出すること、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行うことをコンピュータに実行させるオーディオ符号化用コンピュータプログラム。
(付記18)
オーディオ信号の複数のチャネルに含まれるチャネル信号をダウンミックスした符号化チャネル信号と、
前記複数のチャネル間の強度差と類似度を含む符号化空間情報と、
前記複数のチャネルに含まれる第1チャネル信号と第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかで予測符号化が行われたことを示す選択情報と、
が多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号を前記選択情報に基づいてマトリクス変換するマトリクス変換部と、
を備えることを特徴とするオーディオ復号装置。
(付記19)
前記符号化チャネル信号を復号し、ステレオ周波数信号を生成するチャネル復号部と、
前記符号化空間情報を復号し、空間情報を生成する空間情報復号部と、
前記ステレオ周波数信号と、前記空間情報に基づいて前記第1チャネル信号、前記第2チャネル信号または前記第3チャネル信号の何れかを予測復号する予測復号部と、
を更に備えることを特徴とする付記18記載のオーディオ復号装置。
(付記20)
オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出する算出部と、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行う予測符号化部と、
前記オーディオ信号の複数のチャネルに含まれるチャネル信号をダウンミックスした符号化チャネル信号と、
前記複数のチャネル間の強度差と類似度を含む符号化空間情報と、
前記複数のチャネルに含まれる第1チャネル信号と第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかで予測符号化が行われたことを示す選択情報と、
が多重化された入力信号を分離する分離部と、
前記符号化チャネル信号を復号し、ステレオ周波数信号を生成するチャネル復号部と、
前記符号化空間情報を復号し、空間情報を生成する空間情報復号部と、
前記ステレオ周波数信号と、前記空間情報に基づいて前記第1チャネル信号、前記第2チャネル信号または前記第3チャネル信号の何れかを予測復号する予測復号部と、
前記選択情報に基づいて前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号をマトリクス変換するマトリクス変換部と、
を備えることを特徴とするオーディオ符号化復号システム。
11 時間周波数変換部
12 第1ダウンミックス部
13 算出部
14 第2ダウンミックス部
15 予測符号化部
16 チャネル信号符号化部
17 SBR符号化部
18 周波数時間変換部
19 AAC符号化部
20 空間情報符号化部
21 多重化部
100 オーディオ復号装置
101 分離部
102 チャネル信号復号部
103 AAC復号部
104 時間周波数変換部
105 SBR復号部
106 空間情報復号部
107 予測復号部
108 マトリクス変換部
109 判定部
110 変換部
111 アップミックス部
112 周波数時間変換部
Claims (9)
- オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出する算出部と、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行う予測符号化部と、
を備えることを特徴とするオーディオ符号化装置。 - 前記予測符号化部は、前記第1の位相が同位相または逆位相以外の場合は、前記第1の予測符号化を行い、前記第1の位相が同位相または逆位相の場合は、前記第2の予測符号化を行うことを特徴とする請求項1記載のオーディオ符号化装置。
- 前記予測符号化部は、前記第1の予測符号化または前記第2の予測符号化の何れかで予測符号化を行ったことを示す選択情報を生成することを特徴とする請求項1または請求項2記載のオーディオ符号化装置。
- 前記選択情報に基づいて前記第1チャネル信号と前記第2チャネル信号から第1のステレオ周波数信号または、
前記第1チャネル信号と前記第3チャネル信号から第2のステレオ周波数信号の何れかを生成するダウンミックス部を更に備えることを特徴とする請求項1ないし請求項3の何れか1項に記載のオーディオ符号化装置。 - 前記予測符号化部は、前記第2の予測符号化を行う場合、
予測符号化後の前記第2チャネル信号と、予測符号化前の前記第2チャネル信号との差分で規定される第1の誤差と、
前記第2チャネル信号を用いて前記第1チャネル信号を予測した予測符号後の前記第1チャネル信号と、予測符号化前の前記第1チャネル信号との差分で規定される第2の誤差と、を算出し、
前記第1の誤差と前記第2の誤差を比較し、前記第1の誤差よりも前記第2の誤差が小さい場合、前記第1チャネル信号を用いて前記第2チャネル信号を予測せずに、前記第2チャネル信号を用いて前記第1チャネル信号を予測することを特徴とする請求項1ないし請求項4の何れか1項に記載のオーディオ符号化装置。 - オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出すること、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行うことを含むオーディオ符号化方法。 - オーディオ信号の複数のチャネルに含まれる第1チャネル信号と第2チャネル信号との位相を示す第1の位相を算出すること、
前記第1チャネル信号と前記第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかを、前記第1の位相に基づいて行うことをコンピュータに実行させるオーディオ符号化用コンピュータプログラム。 - オーディオ信号の複数のチャネルに含まれるチャネル信号をダウンミックスした符号化チャネル信号と、
前記複数のチャネル間の強度差と類似度を含む符号化空間情報と、
前記複数のチャネルに含まれる第1チャネル信号と第2チャネル信号とを用いて前記複数のチャネルに含まれる第3チャネル信号を予測する第1の予測符号化または、
前記第1チャネル信号を用いて前記第2チャネル信号を予測する第2の予測符号化の何れかで予測符号化が行われたことを示す選択情報と、
が多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号を前記選択情報に基づいてマトリクス変換するマトリクス変換部と、
を備えることを特徴とするオーディオ復号装置。 - 前記符号化チャネル信号を復号し、ステレオ周波数信号を生成するチャネル復号部と、
前記符号化空間情報を復号し、空間情報を生成する空間情報復号部と、
前記ステレオ周波数信号と、前記空間情報に基づいて前記第1チャネル信号、前記第2チャネル信号または前記第3チャネル信号の何れかを予測復号する予測復号部と、
を更に備えることを特徴とする請求項8記載のオーディオ復号装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147500A JP6051621B2 (ja) | 2012-06-29 | 2012-06-29 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 |
US13/916,848 US9299354B2 (en) | 2012-06-29 | 2013-06-13 | Audio encoding device and audio encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147500A JP6051621B2 (ja) | 2012-06-29 | 2012-06-29 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014010335A true JP2014010335A (ja) | 2014-01-20 |
JP6051621B2 JP6051621B2 (ja) | 2016-12-27 |
Family
ID=49779010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012147500A Expired - Fee Related JP6051621B2 (ja) | 2012-06-29 | 2012-06-29 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9299354B2 (ja) |
JP (1) | JP6051621B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10356407B2 (en) * | 2015-11-20 | 2019-07-16 | Facebook Technologies, Llc | Display-side video decompression using quantization tables |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209588A (ja) * | 2010-03-30 | 2011-10-20 | Fujitsu Ltd | ダウンミクス装置およびダウンミクス方法 |
JP2011527763A (ja) * | 2008-07-11 | 2011-11-04 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルの符号化及び復号化方法並びに装置 |
JP2012073351A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
-
2012
- 2012-06-29 JP JP2012147500A patent/JP6051621B2/ja not_active Expired - Fee Related
-
2013
- 2013-06-13 US US13/916,848 patent/US9299354B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527763A (ja) * | 2008-07-11 | 2011-11-04 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルの符号化及び復号化方法並びに装置 |
JP2011209588A (ja) * | 2010-03-30 | 2011-10-20 | Fujitsu Ltd | ダウンミクス装置およびダウンミクス方法 |
JP2012073351A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US9299354B2 (en) | 2016-03-29 |
US20140006035A1 (en) | 2014-01-02 |
JP6051621B2 (ja) | 2016-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4616349B2 (ja) | ステレオ互換性のあるマルチチャネルオーディオ符号化 | |
US8046214B2 (en) | Low complexity decoder for complex transform coding of multi-channel sound | |
KR101679083B1 (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
RU2696952C2 (ru) | Аудиокодировщик и декодер | |
EP2396637A1 (en) | Ambience coding and decoding for audio applications | |
JP5949270B2 (ja) | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム | |
US20120163608A1 (en) | Encoder, encoding method, and computer-readable recording medium storing encoding program | |
KR20170017873A (ko) | 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
JP6094322B2 (ja) | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 | |
JP6051621B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP6303435B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
CN118016077A (zh) | 包括编码hoa表示的位流的解码方法和装置、以及介质 | |
JP6299202B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160329 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20160401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6051621 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |