JP2010204533A - オーディオ復号装置及びオーディオ復号方法 - Google Patents
オーディオ復号装置及びオーディオ復号方法 Download PDFInfo
- Publication number
- JP2010204533A JP2010204533A JP2009051938A JP2009051938A JP2010204533A JP 2010204533 A JP2010204533 A JP 2010204533A JP 2009051938 A JP2009051938 A JP 2009051938A JP 2009051938 A JP2009051938 A JP 2009051938A JP 2010204533 A JP2010204533 A JP 2010204533A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- signal
- time
- channel
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 59
- 230000005236 sound signal Effects 0.000 claims abstract description 206
- 238000001228 spectrum Methods 0.000 claims abstract description 205
- 238000006243 chemical reaction Methods 0.000 claims abstract description 74
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 108
- 230000001052 transient effect Effects 0.000 claims description 98
- 238000001514 detection method Methods 0.000 claims description 51
- 238000013139 quantization Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 54
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】オーディオ復号装置1は、複数のチャネルを持つ符号化された第1のオーディオ信号の各チャネルの第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列を算出するスペクトル変換部23と、全てのチャネルの第1の信号列のうち、同一時刻及び同一周波数帯域の信号を加重加算することにより、少なくとも一つの第2の信号列を合成するダウンミックス部24と、第2の信号列を第2の周波数スペクトルに変換するスペクトル逆変換部(26a、26b)と、第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する音声再構成部(27a、27b)とを有する。
【選択図】図2
Description
しかし、デジタル放送を受信して、オーディオ信号を再生するオーディオ復号装置の中には、5.1ch音声の復号及び再生に対応していない装置も多数存在する。そのため、5.1ch音声のようなマルチチャネルオーディオ信号から、ステレオオーディオ信号など、オリジナルのマルチチャネルオーディオ信号よりもチャネル数の少ないオーディオ信号を合成するためのダウンミックス技術が必要とされている。
このオーディオ復号装置は、5.1chのオーディオ信号に対してダウンミックス処理を実行することにより、2チャネルのステレオオーディオ信号を合成する。その際、このオーディオ復号装置は、5.1chのオーディオ信号に含まれる各チャネルのMDCT係数を、時間解像度と周波数解像度が一致するように分割した後にダウンミックス処理を実行する。そしてこのオーディオ復号装置は、ダウンミックス処理された信号を、所定の時間解像度及び所定の周波数解像度を持つMDCT係数に変換した後、得られたMDCT係数を時間領域のオーディオ信号に変換する。これにより、このオーディオ復号装置は、チャネルごとに異なる長さの窓を使用して符号化された5.1chのオーディオ信号についても、一旦時間領域のオーディオ信号に変換することなくダウンミックス処理を実行する。
そして信号取得部11は、処理部14と接続され、受信したオーディオ信号を処理部14へ出力する。
そしてオーディオ符号化装置は、窓の長さの前半部分が、1時刻前にMDCT処理を行ったときに用いられた窓の後半部分と重複するように、時間軸に沿って窓の位置をずらしながら、入力されたオーディオ信号に対して順次MDCT処理を実行する。
・リスナーに対して、左前方から出力される音声に対応する左前方チャネル
・リスナーに対して、右前方から出力される音声に対応する右前方チャネル
・リスナーに対して、正面から出力される音声に対応する中央チャネル
・リスナーに対して、左後方から出力される音声に対応する左後方チャネル
・リスナーに対して、右後方から出力される音声に対応する右後方チャネル
・低域音に対応する低域強調チャネル
デマルチプレクサ21は、各チャネルの量子化され、符号化されたMDCT係数の組を、各チャネルに対応する逆量子化部22a〜22fへそれぞれ渡す。
なお、デマルチプレクサ21は、オーディオ復号装置で使用される様々なデマルチプレクサの何れかとすることができるので、デマルチプレクサ21の構成の詳細な説明は省略する。
例えば、逆量子化部22a〜22fは、受信したオーディオ信号に対して適用された符号化方法に応じた復号化処理を実行することにより、量子化値を得る。そして逆量子化部22a〜22fは、得られた量子化値に所定の値を乗じる。逆量子化部22a〜22fは、このような復号処理及び逆量子化処理を複数回繰り返すことにより、MDCT係数の組を得る。
逆量子化部22a〜22fは、それぞれ、得られた各チャネルのMDCT係数の組をスペクトル変換部23に渡す。
上述したように、各チャネルのMDCT係数の組は、異なる長さを持つ窓を用いて求められている可能性がある。そこで、スペクトル変換部23は、オーディオ信号のサンプルを多数含む方の窓に対応する期間を1フレームとして、フレーム単位で各チャネルの時間周波数信号を算出する。なお、本明細書では、オーディオ信号のサンプルを多数含む方の窓をLONG窓と呼ぶ。一方、LONG窓に含まれるサンプルの数よりも少ないサンプルを含む窓をSHORT窓と呼ぶ。
例えば、上記のように、あるフレームにおいて、左前方チャネルのMDCT係数yFL(k)が、サンプルが2048個含まれるLONG窓を用いて求められ、他のチャネルのMDCT係数が、サンプルが256個含まれるSHORT窓を用いて求められているとする。この場合、左前方チャネルのMDCT係数yFL(k)の各値は、それぞれ、例えば、0Hz〜24kHzの周波数範囲を1024等分した周波数帯域に対応する。一方、他のチャネルのMDCT係数の各値は、それぞれ、例えば、0Hz〜24kHzの周波数範囲を128等分した周波数帯域に対応する。すなわち、左前方チャネルのMDCT係数yFL(k)は、他のチャネルのMDCT係数よりも周波数方向の解像度が8倍高い。そこで、スペクトル変換部23は、そのフレームの左前方チャネル以外のMDCT係数の組に含まれる各周波数帯域のMDCT係数を、周波数軸方向に8分割する。スペクトル変換部23は、この分割により得られた各周波数帯域の時間周波数信号の値を、元のMDCT係数において対応する周波数帯域のMDCT係数と同じにしてもよい。あるいは、スペクトル変換部23は、各周波数帯域の時間周波数信号の値を、その周波数帯域に対応する元のMDCT係数と、そのMDCT係数に隣接する周波数帯域のMDCT係数との線形補間により求めてもよい。なお、スペクトル変換部23は、処理部14が信号取得部11を介して受け取ったデータストリームに含まれるヘッダ情報を参照することにより、各チャネルについて使用された窓の長さを知ることができる。
図3(c)及び図3(d)から明らかなように、スペクトル変換部23により得られた各チャネルの時間周波数信号の組330及び340に含まれるそれぞれの時間周波数信号は、時間軸方向及び周波数軸方向の何れについても、擬似的に同じ解像度を持つ。
スペクトル変換部23は、各チャネルの時間周波数信号を、ダウンミックス部24に渡す。
本実施形態では、ダウンミックス部24は、次式に従ってステレオ音声の左右のチャネルに対応する二つの時間周波数信号を合成する。
ダウンミックス部24は、合成された時間周波数信号L'(t,k)及びR'(t,k)を、過渡性検出部25a、25b及びスペクトル逆変換部26a、26bへ渡す。さらにダウンミックス部24は、それら時間周波数信号L'(t,k)及びR'(t,k)を、記憶部13に一時的に記憶する。
過渡性検出部25aは、着目するフレームごとに時間周波数信号L'(t,k)が過渡性を有するか否かの判定結果をスペクトル逆変換部26aに通知する。同様に、過渡性検出部25bは、着目するフレームごとに時間周波数信号R'(t,k)が過渡性を有するか否かの判定結果をスペクトル逆変換部26bに通知する。尚、上記の説明では、過渡性検出部において、時間周波数信号の電力を用いてフレームの過渡性を検出する方法を説明した。しかし、過渡性検出部25a及び25bは、他の簡易な検出方法として、ダウンミックスされる各チャネルのMDCTの窓の長さの情報を用いてもよい。つまり、過渡性検出部25a及び25bは、信号取得部11を介して受け取ったデータストリームに含まれるヘッダ情報を参照することにより、着目するフレームごとに各チャネルについて使用された窓の長さを調べる。そして過渡性検出部25a及び25bは、どれか一つのチャネルでSHORT窓が使用されている場合、着目するフレームに含まれる時間周波数信号は過渡性を有すると判定する。一方、過渡性検出部25a及び25bは、全てのチャネルでLONG窓が使用されている場合、着目するフレームに含まれる時間周波数信号は過渡性を有さないと判定する。
スペクトル逆変換部26aは、得られたMDCT係数y'L(k)を音声再構成部27aに渡す。また、スペクトル逆変換部26bは、得られたMDCT係数y'R(k)を音声再構成部27bに渡す。
音声再構成部27a及び27bは、再構成されたオーディオ信号を、音声再生部12へ出力する。
一方、時間周波数信号が過渡性を有さないと判定された場合(ステップS107−No)、スペクトル逆変換部26a及び26bは、それぞれ、その時間周波数信号をLONG窓に対応するMDCT係数に変換する(ステップS109)。そのために、スペクトル逆変換部26a及び26bは 、着目するフレーム内の各時刻における時間周波数信号の組を一組のMDCT係数に統合するよう、着目するフレーム内の同一周波数帯域の時間周波数の統計値として一つのMDCT係数を算出する。
ステップS108またはS109の後、スペクトル逆変換部26a及び26bは、それぞれ、得られたMDCT係数の組を、処理部14の音声再構成部27a及び27bに渡す。
ダウンミックス部は、各チャネルのオーディオ信号が3種類以上の異なる長さを持つ窓の何れかを用いてMDCT係数が求められている場合も、上記の実施形態と同様に、同一時刻及び同一周波数に対応する各チャネルの時間周波数信号を加重加算すればよい。
そして過渡性検出部は、スペクトル逆変換部に過渡性のレベルの判定結果を通知する。
なお、3種類よりも多い種類の異なる長さを持つ窓の何れかを用いてMDCT係数が求められている場合も、過渡性検出部が上記と同様に過渡性のレベルを判定することにより、スペクトル逆変換部は、時間周波数信号を適切な長さの窓に対応するMDCT係数に変換できる。すなわち、過渡性検出部は、着目するフレームについて、全ての周波数帯域の電力が閾値よりも大きい時刻が連続する期間が長くなるほど、過渡性のレベルが小さいと判定する。そしてスペクトル逆変換部は、着目するフレームの過渡性のレベルが小さいほど、時間周波数信号を長い窓に対応するMDCT係数に変換すればよい。
オーディオ復号装置の処理部は、受信するオーディオ信号のチャネル数に応じた数の逆量子化部と、合成するオーディオ信号のチャネル数に応じた数の過渡性検出部、スペクトル逆変換部及び音声再構成部を有すればよい。
さらに、オーディオ復号装置に対して要求される再生音声の品質レベルによっては、上記の実施形態におけるオーディオ復号装置の処理部において、過渡性判定検出部は省略されてもよい。この場合、処理部のスペクトル逆変換部は、時間周波数信号を、予め定められた長さを持つ窓に対応するMDCT係数の組に変換する。
(付記1)
第1のチャネル数を持つ符号化された第1のオーディオ信号を受信する信号取得部と、
前記第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求める逆量子化部と、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出するスペクトル変換部と、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成するダウンミックス部と、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換するスペクトル逆変換部と、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する音声再構成部と、
を有するオーディオ復号装置。
(付記2)
前記第2のチャネル数は、前記第1のチャネル数よりも少ない、付記1に記載のオーディオ復号装置。
(付記3)
前記第1の所定数の前記第2の信号列を含むフレームの何れかの時刻において、前記第2の信号列の各周波数帯域の電力が所定の閾値以上のとき、該フレームに含まれる前記第2の信号列は過渡性を有すると判定し、該フレームの全ての時刻において、前記第2の信号列の何れかの周波数帯域の電力が所定の閾値未満のとき、該フレームに含まれる前記第2の信号列は過渡性を有さないと判定する過渡性検出部をさらに有し、
前記スペクトル逆変換部は、前記フレームに含まれる前記第2の信号列が過渡性を有するとき、前記第2の信号列の連続する前記第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる各時刻の前記第2の信号列を、それぞれの時刻の前記第2の周波数スペクトルに変換し、前記フレームに含まれる第2の信号列が過渡性を有さないとき、該フレームに含まれる全ての前記第2の信号列の同一周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる全ての前記第2の信号列を一つの前記第2の周波数スペクトルに変換する、付記1または2に記載のオーディオ復号装置。
(付記4)
前記過渡性検出部は、各周波数帯域における前記所定の閾値を、前記フレームよりも前に取得された第3の所定数のフレームについて求められたそれぞれの前記第2の信号列の対応する周波数帯域の電力の平均値に基づいて定める、付記3に記載のオーディオ復号装置。
(付記5)
前記第1の所定数の前記第2の信号列を含むフレームにおいて、前記第2の信号列に対応する何れかのチャネルの前記第1の周波数スペクトルが、第1の時間長よりも短い第2の時間長で時間−周波数変換することにより算出されている場合、該フレームに含まれる前記第2の信号列は過渡性を有すると判定し、該フレームにおいて、前記第2の信号列に対応する全てのチャネルの前記第1の周波数スペクトルが前記第1の時間長で時間−周波数変換することにより算出されている場合、該フレームに含まれる前記第2の信号列は過渡性を有さないと判定する過渡性検出部をさらに有し、
前記スペクトル逆変換部は、前記フレームに含まれる前記第2の信号列が過渡性を有するとき、前記第2の信号列の連続する前記第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる各時刻の前記第2の信号列を、それぞれの時刻の前記第2の周波数スペクトルに変換し、前記フレームに含まれる第2の信号列が過渡性を有さないとき、該フレームに含まれる全ての前記第2の信号列の同一周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる全ての前記第2の信号列を一つの前記第2の周波数スペクトルに変換する、付記1または2に記載のオーディオ復号装置。
(付記6)
前記第1の周波数スペクトルは、前記第1のオーディオ信号の第1のチャネルの信号を第1の時間長で時間−周波数変換することにより算出された長時間周波数スペクトルと、前記第1のオーディオ信号の第2のチャネルの信号を該第1の時間長よりも短い第2の時間長で時間−周波数変換することにより算出された短時間周波数スペクトルとを含み、
前記スペクトル変換部は、前記長時間周波数スペクトルを、前記短時間周波数スペクトルの時間解像度と一致するように時間方向に分割し、前記短時間周波数スペクトルを、前記長時間周波数スペクトルの周波数解像度と一致するように周波数方向に分割する、付記1〜5の何れか一項に記載のオーディオ復号装置。
(付記7)
第1のチャネル数を持つ符号化された第1のオーディオ信号を受信し、
前記第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求め、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出し、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成し、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換し、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する、
ことを含むオーディオ復号方法。
(付記8)
第1のチャネル数を持つ符号化された第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求める逆量子化回路と、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出するスペクトル変換回路と、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のオーディオ信号のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成するダウンミックス回路と、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換するスペクトル逆変換回路と、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する音声再構成回路と、
を有するオーディオ復号回路。
(付記9)
第1のチャネル数を持つ符号化された第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求め、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出し、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のオーディオ信号のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成し、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換し、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する、
ことをコンピュータに実行させるオーディオ復号用コンピュータプログラム。
11 信号取得部
12 音声再生部
13 記憶部
14 処理部
21 デマルチプレクサ
22a〜22f 逆量子化部
23 スペクトル変換部
24 ダウンミックス部
25a、25b 過渡性検出部
26a、26b スペクトル逆変換部
27a、27b 音声再構成部
Claims (7)
- 第1のチャネル数を持つ符号化された第1のオーディオ信号を受信する信号取得部と、
前記第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求める逆量子化部と、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出するスペクトル変換部と、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成するダウンミックス部と、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換するスペクトル逆変換部と、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する音声再構成部と、
を有するオーディオ復号装置。 - 前記第1の所定数の前記第2の信号列を含むフレームの何れかの時刻において、前記第2の信号列の各周波数帯域の電力が所定の閾値以上のとき、該フレームに含まれる前記第2の信号列は過渡性を有すると判定し、該フレームの全ての時刻において、前記第2の信号列の何れかの周波数帯域の電力が所定の閾値未満のとき、該フレームに含まれる前記第2の信号列は過渡性を有さないと判定する過渡性検出部をさらに有し、
前記スペクトル逆変換部は、前記フレームに含まれる前記第2の信号列が過渡性を有するとき、前記第2の信号列の連続する前記第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる各時刻の前記第2の信号列を、それぞれの時刻の前記第2の周波数スペクトルに変換し、前記フレームに含まれる第2の信号列が過渡性を有さないとき、該フレームに含まれる全ての前記第2の信号列の同一周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記フレームに含まれる全ての前記第2の信号列を一つの前記第2の周波数スペクトルに変換する、請求項1に記載のオーディオ復号装置。 - 前記過渡性検出部は、各周波数帯域における前記所定の閾値を、前記フレームよりも前に取得された第3の所定数のフレームについて求められたそれぞれの前記第2の信号列の対応する周波数帯域の電力の平均値に基づいて定める、請求項2に記載のオーディオ復号装置。
- 前記第1の周波数スペクトルは、前記第1のオーディオ信号の第1のチャネルの信号を第1の時間長で時間−周波数変換することにより算出された長時間周波数スペクトルと、前記第1のオーディオ信号の第2のチャネルの信号を該第1の時間長よりも短い第2の時間長で時間−周波数変換することにより算出された短時間周波数スペクトルとを含み、
前記スペクトル変換部は、前記長時間周波数スペクトルを、前記短時間周波数スペクトルの時間解像度と一致するように時間方向に分割し、前記短時間周波数スペクトルを、前記長時間周波数スペクトルの周波数解像度と一致するように周波数方向に分割する、請求項1〜3の何れか一項に記載のオーディオ復号装置。 - 第1のチャネル数を持つ符号化された第1のオーディオ信号を受信し、
前記第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求め、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出し、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成し、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換し、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する、
ことを含むオーディオ復号方法。 - 第1のチャネル数を持つ符号化された第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求める逆量子化回路と、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出するスペクトル変換回路と、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のオーディオ信号のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成するダウンミックス回路と、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換するスペクトル逆変換回路と、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する音声再構成回路と、
を有するオーディオ復号回路。 - 第1のチャネル数を持つ符号化された第1のオーディオ信号の各チャネルについて、符号化されたオーディオ信号を復号し、且つ逆量子化して第1の周波数スペクトルをそれぞれ求め、
前記第1のオーディオ信号の各チャネルについて、前記第1の周波数スペクトルを、時間方向または周波数方向に分割することにより、前記第1のオーディオ信号の全てのチャネルに対して同一の時間解像度及び周波数解像度を有する第1の信号列をそれぞれ算出し、
前記全てのチャネルの第1の信号列に含まれる、同一時刻及び同一周波数帯域の信号を加重加算することにより、前記第1のオーディオ信号のチャネル数と異なる第2のチャネル数を持つ第2の信号列を合成し、
前記第2の信号列の各チャネルについて、時間方向に連続する第1の所定数の前記第2の信号列のそれぞれに含まれる、同一周波数帯域の信号から当該周波数帯域の周波数スペクトル値を一つ求めることにより、または、前記第2の信号列のうち、周波数方向に連続する第2の所定数の周波数帯域の信号から一つの周波数スペクトル値を求めることにより、前記第2の信号列を前記第2のチャネル数を持つ第2の周波数スペクトルに変換し、
前記第2の周波数スペクトルを時間領域の第2のオーディオ信号に変換する、
ことをコンピュータに実行させるオーディオ復号用コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051938A JP5163545B2 (ja) | 2009-03-05 | 2009-03-05 | オーディオ復号装置及びオーディオ復号方法 |
US12/659,306 US8706508B2 (en) | 2009-03-05 | 2010-03-03 | Audio decoding apparatus and audio decoding method performing weighted addition on signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051938A JP5163545B2 (ja) | 2009-03-05 | 2009-03-05 | オーディオ復号装置及びオーディオ復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010204533A true JP2010204533A (ja) | 2010-09-16 |
JP5163545B2 JP5163545B2 (ja) | 2013-03-13 |
Family
ID=42679016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009051938A Expired - Fee Related JP5163545B2 (ja) | 2009-03-05 | 2009-03-05 | オーディオ復号装置及びオーディオ復号方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8706508B2 (ja) |
JP (1) | JP5163545B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013031953A1 (ja) * | 2011-08-31 | 2013-03-07 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
KR101687658B1 (ko) * | 2015-11-25 | 2016-12-19 | 한국항공우주연구원 | 처프-지 역변환 방법 및 시스템 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
KR102033304B1 (ko) * | 2013-05-24 | 2019-10-17 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
EP3182410A3 (en) * | 2015-12-18 | 2017-11-01 | Dolby International AB | Enhanced block switching and bit allocation for improved transform audio coding |
EP3616196A4 (en) | 2017-04-28 | 2021-01-20 | DTS, Inc. | AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09252254A (ja) * | 1995-09-29 | 1997-09-22 | Nippon Steel Corp | オーディオ復号装置 |
JP2000181473A (ja) * | 1998-12-10 | 2000-06-30 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号処理方法および装置 |
JP2002132295A (ja) * | 2000-10-27 | 2002-05-09 | Matsushita Electric Ind Co Ltd | ステレオオーディオ信号高能率符号化装置 |
JP2002536681A (ja) * | 1999-01-28 | 2002-10-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 適応性のあるブロック長符号化システムのためのデータ構成 |
JP2004206771A (ja) * | 2002-12-24 | 2004-07-22 | Sanyo Electric Co Ltd | 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
US5867819A (en) * | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
US6931291B1 (en) * | 1997-05-08 | 2005-08-16 | Stmicroelectronics Asia Pacific Pte Ltd. | Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions |
US6122619A (en) * | 1998-06-17 | 2000-09-19 | Lsi Logic Corporation | Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor |
JP4174859B2 (ja) | 1998-07-15 | 2008-11-05 | ヤマハ株式会社 | デジタルオーディオ信号のミキシング方法およびミキシング装置 |
DE602005006777D1 (de) | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
-
2009
- 2009-03-05 JP JP2009051938A patent/JP5163545B2/ja not_active Expired - Fee Related
-
2010
- 2010-03-03 US US12/659,306 patent/US8706508B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09252254A (ja) * | 1995-09-29 | 1997-09-22 | Nippon Steel Corp | オーディオ復号装置 |
JP2000181473A (ja) * | 1998-12-10 | 2000-06-30 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号処理方法および装置 |
JP2002536681A (ja) * | 1999-01-28 | 2002-10-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 適応性のあるブロック長符号化システムのためのデータ構成 |
JP2002132295A (ja) * | 2000-10-27 | 2002-05-09 | Matsushita Electric Ind Co Ltd | ステレオオーディオ信号高能率符号化装置 |
JP2004206771A (ja) * | 2002-12-24 | 2004-07-22 | Sanyo Electric Co Ltd | 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013031953A1 (ja) * | 2011-08-31 | 2013-03-07 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
US9584906B2 (en) | 2011-08-31 | 2017-02-28 | The University Of Electro-Communications | Mixing device, mixing signal processing device, mixing program and mixing method |
KR101687658B1 (ko) * | 2015-11-25 | 2016-12-19 | 한국항공우주연구원 | 처프-지 역변환 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP5163545B2 (ja) | 2013-03-13 |
US20100228552A1 (en) | 2010-09-09 |
US8706508B2 (en) | 2014-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5163545B2 (ja) | オーディオ復号装置及びオーディオ復号方法 | |
JP6472863B2 (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
RU2625444C2 (ru) | Система обработки аудио | |
JP4401173B2 (ja) | 信号合成方法 | |
KR101117336B1 (ko) | 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치 | |
JP4794448B2 (ja) | オーディオエンコーダ | |
US9275648B2 (en) | Method and apparatus for processing audio signal using spectral data of audio signal | |
RU2639952C2 (ru) | Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
JP5737077B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP2004535145A (ja) | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 | |
KR101647576B1 (ko) | 스테레오 오디오 신호 인코더 | |
KR20120095920A (ko) | 최적의 저-스루풋 파라메트릭 코딩/디코딩 | |
US20120072207A1 (en) | Down-mixing device, encoder, and method therefor | |
JPWO2009131066A1 (ja) | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム | |
CA3212985A1 (en) | Combining spatial audio streams | |
US20100121632A1 (en) | Stereo audio encoding device, stereo audio decoding device, and their method | |
US8825495B2 (en) | Acoustic signal processing system, acoustic signal decoding apparatus, processing method in the system and apparatus, and program | |
EP2610867A1 (en) | Audio reproducing device and audio reproducing method | |
US9311925B2 (en) | Method, apparatus and computer program for processing multi-channel signals | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
KR101464977B1 (ko) | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 | |
CN116458172A (zh) | 空间音频参数编码和相关解码 | |
WO2022223133A1 (en) | Spatial audio parameter encoding and associated decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121203 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5163545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |