JP6094322B2 - 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 - Google Patents

直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 Download PDF

Info

Publication number
JP6094322B2
JP6094322B2 JP2013070385A JP2013070385A JP6094322B2 JP 6094322 B2 JP6094322 B2 JP 6094322B2 JP 2013070385 A JP2013070385 A JP 2013070385A JP 2013070385 A JP2013070385 A JP 2013070385A JP 6094322 B2 JP6094322 B2 JP 6094322B2
Authority
JP
Japan
Prior art keywords
coefficient
modified discrete
cosine transform
discrete cosine
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013070385A
Other languages
English (en)
Other versions
JP2014195152A (ja
Inventor
洋平 岸
洋平 岸
晃 釜野
晃 釜野
俊輔 武内
俊輔 武内
猛 大谷
猛 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013070385A priority Critical patent/JP6094322B2/ja
Priority to EP14162329.8A priority patent/EP2784776B1/en
Priority to US14/229,150 priority patent/US9632982B2/en
Publication of JP2014195152A publication Critical patent/JP2014195152A/ja
Application granted granted Critical
Publication of JP6094322B2 publication Critical patent/JP6094322B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0272Quadrature mirror filters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Description

本発明は、例えば、直交変換装置、直交変換方法及び直交変換用コンピュータプログラム及びそれらを利用したオーディオ復号装置に関する。
従来より、3チャネル以上のチャネルを持つマルチチャネルオーディオ信号のデータ量を圧縮するためのオーディオ信号の符号化方式が開発されている。そのような符号化方式の一つとして、Moving Picture Experts Group (MPEG)により標準化されたMPEG Surround方式が知られている(例えば、非特許文献1を参照)。MPEG Surround方式では、複数チャネルの信号をダウンミックスすることにより、元の各チャネルの信号の主要成分を表す主信号と空間情報が生成され、この主信号及び空間情報が符号化される。さらに、この符号化方式では、主信号と直交する成分を表す残差信号がさらに算出され、その残差信号も符号化されることがある。
主信号及び残差信号は、ダウンミックスにより得られた信号が一旦時間領域の信号に変換された後、さらに、修正離散コサイン変換(Modified Discrete Cosine Transform, MDCT)によって周波数領域の信号に変換されることによって得られる。このうち、主信号は、復号される際、空間情報を用いてアップミックスするために、一旦時間領域の信号に変換された後、直交ミラーフィルタ(Quadrature Mirror Filter, QMF)により、時間周波数領域の信号であるQMF係数に変換される。そのため、残差信号をアップミックスの際に利用するために、周波数領域の残差信号も時間周波数領域のQMF係数に変換される。
ISO/IEC23003-1
上記のように、MPEG Surround方式で符号化されたオーディオ信号を復号するためには、MDCT、QMFなどの直交変換処理を何度も実行することになるので、演算量が非常に多い。そして演算量が多いほど、オーディオ復号装置に要求される演算能力も高くなり、かつ、オーディオ復号装置の消費電力も多くなる。そのため、MPEG Surround方式で符号化されたオーディオ信号を復号するために要する演算量を削減することが求められている。
そこで、本明細書は、一つの側面として、周波数領域の信号を時間周波数領域の信号に変換する際の演算量を削減可能な直交変換装置を提供することを目的とする。
一つの実施形態によれば、所定区間に含まれる修正離散コサイン変換係数を直交ミラーフィルタ係数に変換する直交変換装置が提供される。この直交変換装置は、所定区間の前半に含まれる修正離散コサイン変換係数と所定区間の後半に含まれる修正離散コサイン変換係数の順序を入れ替える入れ替え部と、順序の入れ替え後における所定区間の後半の修正離散コサイン変換係数の符号を反転する反転部と、順序の入れ替え後における所定区間の前半の修正離散コサイン変換係数及び順序の入れ替え後における所定区間の後半の符号反転された修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで直交ミラーフィルタ係数の実数成分を算出する逆コサイン変換部と、順序の入れ替え後における所定区間の前半の修正離散コサイン変換係数及び順序の入れ替え後における所定区間の後半の符号反転された修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散サイン変換を実行することで直交ミラーフィルタ係数の虚数成分を算出する逆サイン変換部と、直交ミラーフィルタ係数の実数成分と直交ミラーフィルタ係数の虚数成分を合成することで直交ミラーフィルタ係数を算出する係数調整部とを有する。
本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
本明細書に開示された直交変換装置は、周波数領域の信号を時間周波数領域の信号に変換する際の演算量を削減できる。
一つの実施形態による直交変換装置を有するオーディオ復号装置の概略構成図である。 符号化されたオーディオ信号が格納されたデータ形式の一例を示す図である。 類似度に対する量子化テーブルの一例を示す図である。 強度差に対する量子化テーブルの一例を示す図である。 予測係数に対する量子化テーブルの一例を示す図である。 MDCT係数からQMF係数への変換の概念図である。 直交変換部の構成図である。 バタフライ演算部の構成図である。 バタフライIMDCTの基底コサイン関数と通常のIMDCTの基底コサイン関数の関係を示す図である。 バタフライ演算適用区間内のMDCT係数の入れ替えの説明図である。 逆コサイン変換部の構成図である。 直交変換処理の動作フローチャートである。 本実施形態により再生されるオーディオ信号のスペクトルと、MDCT係数の順序の入れ替え及び符号反転を実施せずに、バタフライIMDCT、バタフライIMDSTをFFTを利用して実行した場合に再生されるオーディオ信号のスペクトルとの比較を表す図である。 オーディオ復号装置により実行されるオーディオ復号処理の動作フローチャートである。 変形例によるバタフライ演算部の構成図である。 上記の実施形態またはその変形例によるオーディオ復号装置の各部の機能を実現するコンピュータプログラムが動作することにより、オーディオ復号装置として動作するコンピュータの構成図である。
以下、図を参照しつつ、一つの実施形態による直交変換装置について説明する。
MPEG Surround方式で符号化されたオーディオ信号を復号する処理において最も演算量が多いのは、周波数領域の残差信号(MDCT係数)を時間周波数領域の信号(QMF係数)に変換する処理である。例えば、ISOのリファレンスデコーダでは、この変換処理の演算量が、復号処理全体の演算量の約70%にもなる。したがって、MDCT係数をQMF係数に変換する際の演算量を減らせれば、MPEG Surround方式で符号化されたオーディオ信号を復号する際の演算量も削減できる。
そこで、この直交変換装置は、MDCT係数をQMF係数に変換する際の演算量を削減する。特に、この直交変換装置は、MDCT係数をQMF係数に変換する際に利用される、バタフライ逆修正離散コサイン変換(Inverse MDCT, IMDCT)及びバタフライ逆修正離散サイン変換(Inverse Modified Discrete Sine Transform, IMDST)を、高速フーリエ変換(Fast Fourier Transform, FFT)を利用して高速化する。その際、この直交変換装置は、通常のIMDCT及びIMDSTと、バタフライIMDCT及びバタフライIMDSTとの間で異なるフレーム長及び位相の違いを予め補償することで、信号が劣化することを防止する。
なお、本実施形態では、復号対象となるマルチチャネルオーディオ信号は、5.1chオーディオ信号である。しかし、復号対象となるマルチチャネルオーディオ信号は、5.1chオーディオ信号に限られず、例えば、7.1chのマルチチャネルオーディオ信号であってもよい。
図1は、一つの実施形態によるオーディオ復号装置1の概略構成図である。図1に示すように、オーディオ復号装置1は、分離部11と、主信号復号部12と、時間周波数変換部13と、空間情報復号部14と、残差信号復号部15と、直交変換部16と、アップミックス部17と、周波数時間変換部18とを有する。
オーディオ復号装置1が有するこれらの各部は、それぞれ別個の回路として形成される。あるいはオーディオ復号装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路としてオーディオ復号装置1に実装されてもよい。さらに、オーディオ復号装置1が有するこれらの各部は、オーディオ復号装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
分離部11は、符号化されたオーディオ信号を含むデータストリームから、符号化されたオーディオ信号が格納されたデータ形式にしたがって、主信号符号と、空間情報符号と、符号化された残差信号とを取り出す。なお、主信号符号は、Advanced Audio Coding(AAC)符号及びSpectral Band Replication(SBR)符号を含む。
図2は、符号化されたオーディオ信号が格納されたデータ形式の一例を示す図である。この例では、符号化されたオーディオ信号は、MPEG-4 ADTS(Audio Data Transport Stream)形式に従って作成される。
図2に示される符号化データ列200において、データブロック210にAAC符号は格納される。またADTS形式のFILLエレメントが格納されるブロック220の一部領域にSBR符号、空間情報符号及び符号化された残差信号が格納される。
分離部11は、主信号符号を主信号復号部12へ出力する。さらに分離部11は、空間情報符号を空間情報復号部14へ出力し、符号化された残差信号を残差信号復号部15へ出力する。
主信号復号部12は、元のオーディオ信号の各チャネルをダウンミックスすることで生成されるステレオ信号の主成分を表す主信号が符号化された主信号符号を復号する。主信号復号部12は、AAC符号について、例えば、ISO/IEC14496-3規格に記載されているAAC符号に対する復号処理を実行して左側チャネル及び右側チャネルの低周波数成分を再生する。すなわち、主信号復号部12は、AAC符号をエントロピー復号することによって量子化信号を再生し、その量子化信号を逆量子化することでMDCT係数を再生する。そして主信号復号部12は、再生したMDCT係数に対してIMDCT処理を行うことで、フレーム単位の左側チャネル及び右側チャネルの低周波数成分を再生する。
また主信号復号部12は、SBR符号も、例えば、ISO/IEC14496-3規格に記載されているSBR符号に対する復号処理を実行してフレーム単位で左側チャネル及び右側チャネルの高周波数成分を再生する。そして主信号復号部12は、チャネルごとに、その低周波数成分と高周波数成分とを合成することで、ステレオ信号の左側チャネルの信号及び右側チャネルの信号を再生する。そして主信号復号部12は、再生したステレオ信号を時間周波数変換部13へ出力する。
時間周波数変換部13は、直交ミラーフィルタ処理部の一例であり、再生されたステレオ信号の時間領域の各チャネルの信号を、それぞれフレーム単位でQMFフィルタバンクを用いて時間周波数領域のQMF係数に変換する。
なお、QMFフィルタバンクは次式で表される。
ここでnは時間を表す変数であり、1フレームのステレオ信号を時間方向に128等分したときのn番目の時間を表す。なお、フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。
時間周波数変換部13は、得られたQMF係数をアップミックス部17へ出力する。
空間情報復号部14は、分離部11から受け取った空間情報符号を復号する。なお、空間情報には、例えば、音の広がりを表す二つのチャネル間の類似度ICCと、音の定位を表す二つのチャネル間の強度差CLDが含まれる。さらに、空間情報には、右側チャネルと左側チャネルの信号から中央チャネルの信号を予測する予測係数CPCが含まれる。なお、類似度ICC、強度差CLD及び予測係数CPCは、オーディオ信号をダウンミックスする際に、周波数ごとに求められる。そして空間情報符号には、類似度ICC、強度差CLD及び予測係数CPCのそれぞれについてのハフマン符号が含まれる。
空間情報復号部14は、隣接する周波数間の類似度ICCなどのインデックス値間の差分値とハフマン符号との対応関係を表すテーブルを参照してインデックスの差分値を再生する。空間情報復号部14は、その差分値を周波数帯域ごとに順次加算していくことにより、各周波数帯域のインデックス値を再生する。そして空間情報復号部14は、インデックス値と、類似度ICC、強度差CLDまたは予測係数CPCの量子化値との対応関係を表すテーブルを参照して、そのインデックス値に対応する類似度ICC、強度差CLD及び予測係数CPCの量子化値を決定する。
図3は、類似度に対する量子化テーブルの一例を示す図である。図3に示す量子化テーブル300において、上側の行310の各欄はインデックス値を表し、下側の行320の各欄は、同じ列のインデックス値に対応する類似度の量子化値を表す。また、類似度が取りうる値の範囲は-0.99〜+1である。例えば、周波数帯域kに対するインデックス値が3である場合、空間情報復号部14は、量子化テーブル300を参照することにより、類似度の量子化値を、そのインデックス値3に対応する0.60092とする。
図4は、強度差に対する量子化テーブルの一例を示す図である。図4に示す量子化テーブル400において、行410、430及び450の各欄はインデックス値を表し、行420、440及び460の各欄は、それぞれ、同じ列の行410、430及び450の各欄に示されたインデックス値に対応する強度差の量子化値を表す。
例えば、周波数帯域kに対するインデックス値が5である場合、空間情報復号部14は、量子化テーブル400を参照することにより、強度差の量子化値を、そのインデックス値5に対応する10とする。
図5は、予測係数に対する量子化テーブルの一例を示す図である。図5に示す量子化テーブル500において、行510、520、530、540及び550の各欄はインデックス値を表す。また行515、525、535、545及び555の各欄は、それぞれ、同じ列の行510、520、530、540及び550の各欄に示されたインデックス値に対応する予測係数の量子化値を表す。
例えば、周波数帯域kに対するインデックス値が3である場合、空間情報復号部14は、量子化テーブル500を参照することにより、予測係数の量子化値を、そのインデックス値3に対応する0.3とする。
空間情報復号部14は、各周波数帯域の空間情報の量子化値をアップミックス部17へ出力する。
残差信号復号部15は、符号化された、主信号と直交する成分である残差信号を復号する。MPEG Surround方式では、残差信号もAAC符号化されるので、その符号化の際に、残差信号に対してMDCTが実行される。したがって、残差信号復号部15は、例えば、ISO/IEC13818-7規格に記載されたAAC符号を復号する方法に従って残差信号を復号することにより、MDCT係数で表された残差信号が再生される。このMDCT係数は、直交変換部16へ出力される。
直交変換部16は、直交変換装置の一例であり、周波数領域の信号であるMDCT係数で表された残差信号を、時間周波数領域の信号であるQMF係数に変換する。なお、直交変換部16の詳細については後述する。
アップミックス部17は、周波数帯域ごとに、ステレオ信号の左側チャネル及び右側チャネルのQMF係数及び残差信号のQMF係数を、空間情報に基づいてアップミックスすることにより、5.1chのオーディオ信号の各チャネルのQMF係数を再生する。そのために、アップミックス部17は、例えば、ISO/IEC23003-1規格で規定されたアップミックスの手法を利用すればよい。例えば、アップミックス部17は、ステレオ信号の左側チャネルのQMF係数及び右側チャネルのQMF係数と、残差信号のQMF係数とを、空間情報を用いてアップミックスすることで、左側、右側、及び中央の3チャネルのQMF係数を算出する。さらに、アップミックス部17は、算出された左側チャネルのQMF係数を、左前方チャネルと左後方チャネルをダウンミックスする際に算出された空間情報を用いてアップミックスすることで、左前方チャネル及び左後方チャネルのQMF係数を算出する。同様に、アップミックス部17は、算出された右側チャネルのQMF係数を、右前方チャネルと右後方チャネルをダウンミックスする際に算出された空間情報を用いてアップミックスすることで、右前方チャネル及び右後方チャネルのQMF係数を算出する。さらに、アップミックス部17は、算出された中央チャネルのQMF係数を、中央チャネルと重低音チャネルをダウンミックスする際に算出された空間情報を用いてアップミックスすることで、中央チャネル及び重低音チャネルのQMF係数を算出する。
アップミックス部17は、再生した各チャネルのQMF係数を周波数時間変換部18へ出力する。
周波数時間変換部18は、逆直交ミラーフィルタ処理部の一例であり、各チャネルのQMF係数に対して、時間周波数変換部13により実行されるQMFフィルタバンク処理の逆変換処理を実行することにより、5.1chのオーディオ信号を再生する。そしてオーディオ復号装置1は、再生したオーディオ信号を、例えば、スピーカへ出力する。
以下、直交変換部16について詳述する。
図6は、MDCT係数からQMF係数への変換の概念図である。MDCT係数601は、周波数軸方向にのみ複数の係数を有する。一方、QMF係数602は、時間軸方向と周波数軸方向の両方ともに複数の係数を持つ。ここで、連続するN個のMDCT係数を含む周波数帯域に対して通常のIMDCT演算を行うことにより、その周波数帯域に対応する、時間軸方向に沿った2N個の信号が得られる。そのため、MDCT係数全体を複数の周波数帯域によって分割し、周波数帯域ごとにIMDCT演算を実行することにより、QMF係数のように、周波数帯域ごとに、時間軸方向に沿った複数個の係数が得られる。しかし、この場合には、周波数帯域間の折り返し歪みが生じてしまう。
そこで、MDCT係数からQMF係数へ変換するために、ISO/IEC23003-1の規定に従って、周波数帯域603〜605のように、MDCT係数全体が、隣接する周波数帯域同士が半分ずつオーバーラップする複数の周波数帯域で分割される。この場合、各周波数帯域は、通常のIMDCTが適用される周波数帯域の2倍の長さを持ち、例えば、連続する2N個のMDCT係数を含む。そして各周波数帯域に対してバタフライIMDCT演算及びIMDST演算を行うことにより、周波数帯域間の折り返し歪みが相互に打ち消され、周波数帯域ごとに、時間軸方向に沿った2N個のQMF係数が得られる。
しかし、このバタフライIMDCT演算及びIMDST演算の演算量は非常に多い。そこで、本実施形態による直交変換部16は、このバタフライIMDCT演算及びIMDST演算の演算量を削減するために、FFTを利用する。
図7は、直交変換部16の構成図である。直交変換部16は、窓処理部21と、バタフライ演算部22と、係数調整部23とを有する。
窓処理部21は、残差信号のMDCT係数に、バタフライIMDCT及びバタフライIMDST用の窓関数及びゲイン(1/2N)1/2を乗じる。本実施形態では、窓関数wf[n]は、次式で表される。
ただし、(2N)は、バタフライIMDCT演算及びバタフライIMDST演算の適用区間である周波数帯域fに含まれるMDCT係数の数である。またnは、バタフライIMDCT演算及びバタフライIMDST演算の結果として得られる係数の時間軸に沿った順番を表す。窓処理部21は、窓関数及びゲインが乗じられた残差信号のMDCT係数をバタフライ演算部22へ出力する。
図8は、バタフライ演算部22の構成図である。バタフライ演算部22は、窓関数及びゲインが乗じられた残差信号のMDCT係数に対してバタフライIMDCT演算を実行するバタフライ逆コサイン変換部31と、そのMDCT係数に対してバタフライIMDST演算を実行するバタフライ逆サイン変換部32とを有する。本実施形態では、バタフライ逆コサイン変換部31及びバタフライ逆サイン変換部32は、演算量を削減するために、バタフライIMDCT演算及びバタフライIMDST演算をそのまま実行する代わりに、FFTを利用してIMDCT演算及びIMDST演算を実行する方法を採用する。
バタフライIMDCT演算及びバタフライIMDST演算と、通常のIMDCT演算及び通常のIMDST演算には、以下に説明するような相違点が存在する。
一般に、バタフライIMDCT演算は、次式で表される。
一方、通常のIMDCT演算は、次式で表される。
ただし、x[k](k=0,1,2,…,2N-1)は、MDCT係数である。(3)式及び(4)式から明らかなように、バタフライIMDCT演算では、適用区間あたりのMDCT係数の数が通常のIMDCT演算の2倍となる。また、基底コサイン関数の位相が(n+n0)πだけ異なる。同様に、バタフライIMDST演算と通常のIMDST演算に関しても、適用区間あたりのMDCT係数の数と基底サイン関数の位相が異なる。そのため、通常のIMDCT演算及びIMDST演算においてFFTを利用する方法を、バタフライIMDCT演算及びIMDST演算にそのまま適用すると、再生される原信号(本実施形態では残差信号)に疑似信号成分が含まれるようになり、原信号が劣化する。
そこで、バタフライ逆コサイン変換部31及びバタフライ逆サイン変換部32は、適用区間内のMDCT係数の数及び基底関数の位相を、通常のIMDCT演算またはIMDST演算における係数の数及び基底関数の位相と一致させるよう、MDCT係数を並び替え、符号を反転する。
図9を参照しつつ、バタフライIMDCTの基底コサイン関数と通常のIMDCTの基底コサイン関数の関係について説明する。図9において、横軸は、MDCT係数の周波数kを表す。そしてグラフ901は、通常のIMDCTの基底コサイン関数c1[k]を表し、グラフ902は、バタフライIMDCTの基底コサイン関数c2[k]を表す。関数c1[k]、c2[k]は、それぞれ、(3)式及び(4)式における、三角関数の部分に相当するので次式で表される。
図9及び(5)式、(6)式から明らかなように、関数c1[k]と関数c2[k]とでは、kの値がNに相当する分だけ位相がずれている。すなわち、区間[0,N-1]における、バタフライIMDCTの基底コサイン関数c2[k]の値は、区間[N,2N-1]における、通常のバタフライIMDCTの基底コサイン関数c1[k]の値と等しい。
また、基底コサイン関数c1[k]、c2[k]とも、kの値が2Nだけ異なるときのその関数の値c1[k-2N]、c2[k-2N]と比較して、絶対値が等しく、かつ、符号が反転する。すなわち、基底コサイン関数c1[k]とc2[k]の間には、以下の関係が成立する。
したがって、以下の式が成立する。
(8)式に示されるように、区間内の前半のMDCT係数x[k](k=0,1,...,N-1)と後半のMDCT係数x[k](k=N,N+1,...,2N-1)を入れ替えることにより、入れ替え後の前半部分に対しては、通常のIMDCT演算の基底コサイン関数c1[k]が適用可能となる。一方、入れ替え後の後半部分に含まれる各MDCT係数については、符号を反転した上で、通常のIMDCT演算の基底コサイン関数c1[k]が適用可能となる。そして、前半部分と後半部分の長さは、通常のIMDCT演算が適用される区間の長さと等しい。したがって、前半部分と後半部分のそれぞれに対して、通常のIMDCT演算が適用できる。
また、バタフライIMDST演算の基底サイン関数と、通常のIMDST演算の基底サイン関数についても同様の関係が成立する。したがって、バタフライIMDST演算についても、適用区間内の前半のMDCT係数とMDCT係数を入れ替え、入れ替え後の前半のMDCT係数の符号を反転することで、前半部分と後半部分のそれぞれに対して、通常のIMDST演算が適用可能となる。
そこで、バタフライ逆コサイン変換部31は、バタフライIMDCT演算をそのまま実行する代わりに、適用区間内のMDCT係数の順序の入れ替え等を行った上で、FFTを利用した通常のIMDCT演算を実行することで、QMF係数の実数成分を算出する。再度図8を参照すると、バタフライ逆コサイン変換部31は、入れ替え部41と、反転部42と、逆コサイン変換部43−1、43−2と、加算部44とを有する。
同様に、バタフライ逆サイン変換部32は、適用区間内のMDCT係数の順序の入れ替え等を行った上で、FFTを利用した通常のIMDST演算を実行することで、QMF係数の虚数成分を算出する。そのために、バタフライ逆サイン変換部32は、入れ替え部51と、反転部52と、逆サイン変換部53−1、53−2と、加算部54とを有する。
なお、以下では、バタフライ逆コサイン変換部31についてのみ説明する。バタフライ逆サイン変換部32は、変換に用いられる基底関数をコサイン関数からサイン関数に変更するだけで、バタフライ逆コサイン変換部31と同様に、MDCT係数に対してFFTを利用したIMDST演算を行うことでバタフライIMDST演算を実行できる。
図10を参照しつつ、入れ替え部41の処理を説明する。入れ替え部41は、窓関数及びゲインが乗算されたMDCT係数x[k]を、図10の矢印で示されるように前半と後半の順序を入れ替えることで、入れ替え後のMDCT係数x'[k]を求める。この入れ替えの処理は、次式で表される。
入れ替え部41は、入れ替え後のMDCT係数x'[k]の前半部分、すなわち、元のMDCT係数の後半部分を逆コサイン変換部43−1へ出力する。一方、入れ替え部41は、入れ替え後のMDCT係数x'[k]の後半部分、すなわち、元のMDCT係数の前半部分を反転部42へ出力する。
反転部42は、入れ替え後のMDCT係数x'[k]の後半部分の符号を反転する。そして反転部42は、符号反転後のMDCT係数x'[k]を逆コサイン変換部43−2へ出力する。
逆コサイン変換部43−1は、(8)式の右辺の第1項に対するIMDCT演算を、FFTを利用して実行する。一方、逆コサイン変換部43−2は、(8)式の右辺の第2項に対するIMDCT演算を、FFTを利用して実行する。IMDCT演算またはIMDST演算をFFTを利用して実行することによって演算量を削減するために、例えば、Rolf Gluth、「REGULAR FFT-RELATED TRANSFORM KERNELS FOR DCT/DST-BASED POLYPHASE FILTER BANKS」、IEEE Acoustics, Speech, and Signal Processing, ICASSP-91、1991年、vol.3、p.2205-2208に開示された手法が利用可能である。なお、逆コサイン変換部43−1と43−2は、扱うデータ以外は同一なので、以下では、逆コサイン変換部43−1について説明する。
図11は、逆コサイン変換部43−1の構成図である。逆コサイン変換部43−1は、上記の文献に開示された手法に従って、事前回転部61と、高速フーリエ変換部62と、事後回転部63とを有する。
事前回転部61は、基底の三角関数の対称性を利用して計算範囲を狭くするために、次式に従って入力されたMDCT係数x'[k]を1/4ずつ合成することにより、合成関数f[k]を得る。
そして事前回転部61は、次式に従って、合成関数f[k]を複素平面において1/8回転させる。
事前回転部61は、回転された合成関数f'[k]を高速フーリエ変換部62へ出力する。
高速フーリエ変換部62は、合成関数f'[k]に対して、FFTを実行する。なお、高速フーリエ変換部62は、FFTとして知られている様々な演算方法を適用できる。そして高速フーリエ変換部62は、FFTを行うことによって得られた係数F[n]を事後回転部63へ出力する。
事後回転部63は、次式に従って、係数F[n]を、事前回転部61による回転方向とは逆向きに1/8回転させることで係数F'[n]を算出する。
事後回転部63は、次式に従って、複素平面上の係数F'[n]を実数平面上の係数F''[n]に変換する。
ただし、関数Re(x)は、変数xの実数成分を出力する関数であり、関数Im(x)は、変数xの虚数成分を出力する関数である。事後回転部63は、通常のIMDCT用の窓関数、例えば、カイザー・ベッセル窓とゲイン(1/N)1/2を係数F''[n]に乗じることで、MDCT係数x'[k]に対してIMDCTを行って得られる係数と同等の係数を得る。
加算部44は、逆コサイン変換部43−1から出力された係数に、逆コサイン変換部43−2から出力された係数を加算する。これにより、(8)式の右辺の計算が完了するので、MDCT係数に対するバタフライIMDCTが完了し、QMF係数の実数成分が得られる。加算部44は、得られたQMF係数の実数成分を係数調整部23へ出力する。
係数調整部23は、バタフライ演算部22から出力された、MDCT係数をバタフライIMDCTして得られるQMF係数の実数成分と、MDCT係数をバタフライIMDSTして得られるQMF係数の虚数成分とを合成することで、残差信号のQMF係数を得る。具体的には、係数調整部23は、次式に従って、QMF係数を算出する。
ここで、X[n,f]は、MDCT係数をバタフライIMDCTして得られるQMF係数の実数成分であり、Y[n,f]は、MDCT係数をバタフライIMDSTして得られるQMF係数の虚数成分である。そしてZ[n,f]は、得られたQMF係数である。ただし、fは、バタフライIMDCT及びバタフライIMDSTが実行される周波数帯域を表す。
図12は、直交変換部16により実行される直交変換処理の動作フローチャートである。なお、直交変換部16は、個々の周波数帯域に相当する適用区間ごとに、以下の動作フローに従って直交変換処理を実行する。
直交変換部16の窓処理部21は、残差信号のMDCT係数に対して窓関数及びゲインを乗じる(ステップS101)。そして窓処理部21は、窓関数及びゲインが乗じられたMDCT係数を直交変換部16のバタフライ演算部22へ出力する。
バタフライ演算部22の入れ替え部41、51は、それぞれ、適用区間の前半のMDCT係数と、適用区間の後半のMDCT係数の順序を入れ替える(ステップS102)。そしてバタフライ演算部22の反転部42、52は、それぞれ、入れ替え後の適用区間の後半のMDCT係数の符号を反転させる(ステップS103)。
バタフライ演算部22の逆コサイン変換部43−1、43−2は、それぞれ、入れ替え後の適用区間の前半のMDCT係数及び符号反転された適用区間の後半のMDCT係数に対して、FFTを利用してIMDCTを実行する(ステップS104)。そしてバタフライ演算部22の加算部44は、IMDCT後に得られた係数同士を加算することで、QMF係数の実数成分を得る(ステップS105)。
またバタフライ演算部22の逆サイン変換部53−1、53−2は、それぞれ、入れ替え後の適用区間の前半のMDCT係数及び符号反転された適用区間の後半のMDCT係数に対して、FFTを利用してIMDST演算を実行する(ステップS106)。そしてバタフライ演算部22の加算部54は、IMDST後に得られた係数同士を加算することで、QMF係数の虚数成分を得る(ステップS107)。
直交変換部16の係数調整部23は、QMF係数の実数成分と虚数成分を合成することでQMF係数を得る(ステップS108)。そして直交変換部16は、直交変換処理を終了する。
以下のテーブルは、本実施形態による、一つの適用区間に含まれるMDCT係数の数が(2N)である場合における、バタフライIMDCT1回あたりの演算量を示すテーブルである。
テーブルに示されるように、本実施形態では、バタフライIMDCT1回あたりの演算量は、FFTの演算量と同様に、NlogNのオーダーとなる。これに対して、通常通り、バタフライIMDCTをFFTを利用せずに実行した場合、バタフライIMDCT1回あたりの演算量は、(8N2)となる。したがって、例えば、N=32であれば、通常のバタフライIMDCT1回あたりの演算量が8192回となるのに対して、本実施形態によるバタフライIMDCT1回あたりの演算量は312回となり、演算量が大幅に削減されることが分かる。
図13は、本実施形態により再生されるオーディオ信号のスペクトルと、MDCT係数の順序の入れ替え及び符号反転を実施せずに、バタフライIMDCT、バタフライIMDSTをFFTを利用して実行した場合に再生されるオーディオ信号のスペクトルとの比較を表す図である。図13において、スペクトル1301は、原音のスペクトルを表す。またスペクトル1302は、MDCT係数の順序の入れ替え及び符号反転を実施せずに、バタフライIMDCT、バタフライIMDSTをFFTを利用して実行した場合に再生されるオーディオ信号のスペクトルを表す。そしてスペクトル1303は、本実施形態により再生されるオーディオ信号のスペクトルを表す。
MDCT係数の順序の入れ替え及び符号反転を実施せずに、バタフライIMDCT、バタフライIMDSTをFFTを利用して実行した場合、再生されたスペクトルは、原音に対して2重になっており、音質が劣化してしまうことが分かる。これに対して、本実施形態では、再生されたスペクトルは2重にならず、原音のスペクトルとほぼ同様のスペクトルとなっており、音質が保たれていることが分かる。
図14は、オーディオ復号装置1により実行されるオーディオ復号処理の動作フローチャートである。オーディオ復号装置1は、フレームごとに、下記の動作フローチャートに従ってオーディオ信号を再生する。
分離部11は、符号化データストリームからAAC符号、SBR符号といった主信号符号、空間情報符号及び残差信号符号を取り出す(ステップS201)。
主信号復号部12は、分離部11から受け取った主信号符号を復号することにより、ステレオ信号を再生する(ステップS202)。時間周波数変換部13は、得られたステレオ信号に対してQMFフィルタバンクを適用することにより、時間周波数領域のQMF係数に変換する(ステップS203)。
一方、空間情報復号部14は、分離部11から受け取った空間情報符号を復号することにより空間情報を再生する(ステップS204)。そして空間情報復号部14は、得られた空間情報をアップミックス部17へ出力する。
また、残差信号復号部15は、分離部11から受け取った残差信号符号を復号することにより、残差信号のMDCT係数を再生する(ステップS205)。そして直交変換部16は、残差信号のMDCT係数に対して、FFTを利用したバタフライIMDCT及びバタフライIMDSTを実行することにより、残差信号のQMF係数を算出する(ステップS206)。
アップミックス部17は、ステレオ信号のQMF係数及び残差信号のQMF係数を空間情報を用いてアップミックスすることにより、元のオーディオ信号の各チャネルのQMF係数を再生する(ステップS207)。
周波数時間変換部18は、各チャネルのQMF係数を周波数時間変換して各チャネルのオーディオ信号を再生する(ステップS208)。
そしてオーディオ復号装置は、オーディオ復号処理を終了する。
以上に説明してきたように、本実施形態による直交変換装置は、MDCT係数をQMF係数に変換するためのバタフライIMDCT及びバタフライIMDSTの演算量を、FFTを利用したIMDCT及びIMDSTを適用できるようにMDCT係数の順序及び符号を調節することで削減できる。そのため、この直交変換装置を含むオーディオ復号装置は、残差信号のMDCT係数をQMF係数に変換するための演算量を削減できる。
本発明は、上記の実施形態に限定されるものではない。例えば、上記の実施形態における直交変換部16のバタフライ演算部22では、バタフライ逆コサイン変換部31とバタフライ逆サイン変換部32が、それぞれ、入れ替え部と反転部を有している。しかし、入れ替え部と反転部の処理は、バタフライIMDCT及びバタフライIMDSTの両方に適用される。そこで、変形例によれば、予めMDCT係数に対して入れ替え部の処理と反転部の処理を行ってから、それらの処理が行われたMDCT係数が、それぞれ、バタフライ逆コサイン変換部31とバタフライ逆サイン変換部32に入力されてもよい。
図15は、変形例によるバタフライ演算部22’の構成図である。この変形例では、バタフライ演算部22’は、入れ替え部33と、反転部34と、バタフライ逆コサイン変換部35と、バタフライ逆サイン変換部36とを有する。バタフライ逆コサイン変換部35及びバタフライ逆サイン変換部36は、上記の実施形態によるバタフライ逆コサイン変換部31及びバタフライ逆サイン変換部32と異なり、入れ替え部と反転部を有さない。その代わりに、バタフライ逆コサイン変換部35及びバタフライ逆サイン変換部36とは独立して設けられた入れ替え部33が、適用区間の前半のMDCT係数と後半のMDCT係数の順序を入れ替え、反転部34が、入れ替え後の後半のMDCT係数の符号を反転させる。そして入れ替え後の前半のMDCT係数が、入れ替え部33からバタフライ逆コサイン変換部35及びバタフライ逆サイン変換部36のそれぞれへ出力される。また符号反転された、入れ替え後の後半のMDCT係数が、反転部34からバタフライ逆コサイン変換部35及びバタフライ逆サイン変換部36のそれぞれへ出力される。
この変形例では、入れ替え部33と反転部34が一つでよいので、上記の実施形態よりも回路規模が削減できる。
さらなる変形例によれば、図15に示されたバタフライ演算部22’において、バタフライ逆コサイン変換部35は、1個の逆コサイン変換部のみを有してもよい。この場合、その逆コサイン変換部が、2倍の長さの区間のIMDCT、すなわち、(8)式の右辺全体の演算を実行すればよい。ただし、その逆コサイン変換部は、バタフライIMDCTと同様に、2N個のMDCT係数から、2N個の係数を算出する。同様に、バタフライ逆サイン変換部36は、1個の逆サイン変換部のみを有し、その逆サイン変換部が、2倍の長さの区間のIMDSTを実行してもよい。この場合、加算部は省略される。
上記の実施形態または変形例による直交変換装置が有する各部の機能をコンピュータに実現させるコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体などの記録媒体に記憶された形で提供されてもよい。同様に、上記の実施形態または変形例によるオーディオ復号装置が有する各部の機能をコンピュータに実現させるコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体などの記録媒体に記憶された形で提供されてもよい。ただし、そのような記録媒体には、搬送波は含まれない。
図16は、上記の実施形態またはその変形例によるオーディオ復号装置の各部の機能を実現するコンピュータプログラムが動作することにより、オーディオ復号装置として動作するコンピュータの構成図である。
コンピュータ100は、ユーザインターフェース部101と、通信インターフェース部102と、記憶部103と、記憶媒体アクセス装置104と、プロセッサ105と、オーディオインターフェース部106とを有する。プロセッサ105は、ユーザインターフェース部101、通信インターフェース部102、記憶部103、記憶媒体アクセス装置104及びオーディオインターフェース部106と、例えば、バスを介して接続される。
ユーザインターフェース部101は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース部101は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース部101は、例えば、ユーザの操作に応じて、復号するオーディオデータを選択する操作信号をプロセッサ105へ出力する。
通信インターフェース部102は、コンピュータ100を、オーディオデータを符号化する装置、例えば、ビデオカメラと接続するための通信インターフェース及びその制御回路を有してもよい。そのような通信インターフェースは、例えば、Universal Serial Bus(ユニバーサル・シリアル・バス、USB)とすることができる。
さらに、通信インターフェース部102は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有してもよい。
この場合には、通信インターフェース部102は、通信ネットワークに接続された他の機器から、復号する符号化オーディオデータを取得し、そのデータをプロセッサ105へ渡す。
記憶部103は、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そして記憶部103は、プロセッサ105上で実行される、オーディオ復号処理を実行するためのコンピュータプログラム、及びこれらの処理の途中または結果として生成されるデータを記憶する。
記憶媒体アクセス装置104は、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体108にアクセスする装置である。記憶媒体アクセス装置104は、例えば、記憶媒体108に記憶されたプロセッサ105上で実行される、オーディオ復号処理用のコンピュータプログラムを読み込み、プロセッサ105に渡す。
プロセッサ105は、上記の実施形態または変形例によるオーディオ復号処理用コンピュータプログラムを実行することにより、符号化オーディオデータを復号する。そしてプロセッサ105は、復号されたオーディオデータをオーディオインターフェース部106を介してスピーカ107へ出力する。
上記の実施形態またはその変形例による直交変換装置は、MPEG Surround方式に従って符号化されたオーディオ信号の復号以外の用途に利用されてもよい。上記の実施形態またはその変形例による直交変換装置は、MDCT係数をQMF係数へ変換することが求められる様々な装置に適用できる。
また、上記の実施形態または変形例によるオーディオ復号装置は、コンピュータ、ビデオ信号の録画再生機など、符号化されたオーディオ信号を再生するために利用される各種の機器に実装される。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
1 オーディオ復号装置
11 分離部
12 主信号復号部
13 時間周波数変換部
14 空間情報復号部
15 残差信号復号部
16 直交変換部(直交変換装置)
17 アップミックス部
18 周波数時間変換部
21 窓処理部
22、22’ バタフライ演算部
23 係数調整部
31、35 バタフライ逆コサイン変換部
32、36 バタフライ逆サイン変換部
33、41、51 入れ替え部
34、42、52 反転部
43−1、43−2 逆コサイン変換部
53−1、53−2 逆サイン変換部
44、54 加算部
61 事前回転部
62 高速フーリエ変換部
63 事後回転部
100 コンピュータ
101 ユーザインターフェース部
102 通信インターフェース部
103 記憶部
104 記憶媒体アクセス装置
105 プロセッサ
106 オーディオインターフェース部
107 スピーカ
108 記憶媒体

Claims (6)

  1. 所定区間に含まれる修正離散コサイン変換係数を直交ミラーフィルタ係数に変換する直交変換装置であって、
    前記所定区間の前半に含まれる前記修正離散コサイン変換係数と前記所定区間の後半に含まれる前記修正離散コサイン変換係数の順序を入れ替える入れ替え部と、
    前記順序の入れ替え後における前記所定区間の後半の前記修正離散コサイン変換係数の符号を反転する反転部と、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで前記直交ミラーフィルタ係数の実数成分を算出する逆コサイン変換部と、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散サイン変換を実行することで前記直交ミラーフィルタ係数の虚数成分を算出する逆サイン変換部と、
    前記直交ミラーフィルタ係数の実数成分と前記直交ミラーフィルタ係数の虚数成分を合成することで前記直交ミラーフィルタ係数を算出する係数調整部と、
    を有する直交変換装置。
  2. 前記逆コサイン変換部は、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数に対して高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで第1の係数を算出する第1のサブ逆コサイン変換部と、
    前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで第2の係数を算出する第2のサブ逆コサイン変換部と、
    前記第1の係数と前記第2の係数を加算することで前記直交ミラーフィルタ係数の実数成分を算出する加算部と、
    を有する請求項1に記載の直交変換装置。
  3. 前記逆サイン変換部は、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数に対して高速フーリエ変換を利用した逆修正離散サイン変換を実行することで第1の係数を算出する第1のサブ逆サイン変換部と、
    前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して高速フーリエ変換を利用した逆修正離散サイン変換を実行することで第2の係数を算出する第2のサブ逆サイン変換部と、
    前記第1の係数と前記第2の係数を加算することで前記直交ミラーフィルタ係数の虚数成分を算出する加算部と、
    を有する請求項1に記載の直交変換装置。
  4. 所定区間に含まれる修正離散コサイン変換係数を直交ミラーフィルタ係数に変換する直交変換方法であって、
    前記所定区間の前半に含まれる前記修正離散コサイン変換係数と前記所定区間の後半に含まれる前記修正離散コサイン変換係数の順序を入れ替え、
    前記順序の入れ替え後における前記所定区間の後半の前記修正離散コサイン変換係数の符号を反転し、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで前記直交ミラーフィルタ係数の実数成分を算出し、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散サイン変換を実行することで前記直交ミラーフィルタ係数の虚数成分を算出し、
    前記直交ミラーフィルタ係数の実数成分と前記直交ミラーフィルタ係数の虚数成分を合成することで前記直交ミラーフィルタ係数を算出する、
    ことを含む直交変換方法。
  5. 所定区間に含まれる修正離散コサイン変換係数を直交ミラーフィルタ係数に変換することをコンピュータに実行させるための直交変換用コンピュータプログラムであって、
    前記所定区間の前半に含まれる前記修正離散コサイン変換係数と前記所定区間の後半に含まれる前記修正離散コサイン変換係数の順序を入れ替え、
    前記順序の入れ替え後における前記所定区間の後半の前記修正離散コサイン変換係数の符号を反転し、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで前記直交ミラーフィルタ係数の実数成分を算出し、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散サイン変換を実行することで前記直交ミラーフィルタ係数の虚数成分を算出し、
    前記直交ミラーフィルタ係数の実数成分と前記直交ミラーフィルタ係数の虚数成分を合成することで前記直交ミラーフィルタ係数を算出する、
    ことをコンピュータに実行させるための直交変換用コンピュータプログラム。
  6. 複数のチャネルを持つオーディオ信号の各チャネルの信号をダウンミックスすることにより生成される各チャネルの主成分を表す主信号を符号化した主信号符号と、前記主信号と直交する残差信号に対して修正離散コサイン変換処理を行って得られた係数を符号化した残差信号符号と、チャネル間の類似度及び強度差を表す空間情報を符号化した空間情報符号とを含むデータストリームから前記オーディオ信号を復号するオーディオ復号装置であって、
    前記データストリームから前記主信号符号、前記残差信号符号及び前記空間情報を符号を分離する分離部と、
    前記主信号符号を復号することにより時間領域の前記主信号を再生する主信号復号部と、
    前記時間領域の前記主信号に対して直交ミラーフィルタ処理を行うことにより、時間周波数領域の直交ミラーフィルタ係数に変換する直交ミラーフィルタ処理部と、
    前記空間情報符号を復号することにより前記空間情報を再生する空間情報復号部と、
    前記残差信号符号を復号することにより、前記残差信号の修正離散コサイン変換係数を再生する残差信号復号部と、
    周波数帯域全体を区切る、半分ずつ重なるように設定された複数の所定の区間のそれぞれごとに、当該所定の区間に含まれる前記残差信号の修正離散コサイン変換係数を時間周波数領域の直交ミラーフィルタ係数に変換する直交変換部と、
    前記主信号の直交ミラーフィルタ係数と、前記残差信号の直交ミラーフィルタ係数とを、前記空間情報を用いてアップミックスすることにより、前記オーディオ信号の各チャネルの直交ミラーフィルタ係数を算出するアップミックス部と、
    前記各チャネルの直交ミラーフィルタ係数に対して逆直交ミラーフィルタ処理を行うことにより、前記オーディオ信号の各チャネルの信号を再生する逆直交ミラーフィルタ処理部とを有し、
    前記直交変換部は、
    前記所定区間の前半に含まれる前記修正離散コサイン変換係数と前記所定区間の後半に含まれる前記修正離散コサイン変換係数の順序を入れ替える入れ替え部と、
    前記順序の入れ替え後における前記所定区間の後半の前記修正離散コサイン変換係数の符号を反転する反転部と、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散コサイン変換を実行することで前記残差信号の前記直交ミラーフィルタ係数の実数成分を算出する逆コサイン変換部と、
    前記順序の入れ替え後における前記所定区間の前半の前記修正離散コサイン変換係数及び前記順序の入れ替え後における前記所定区間の後半の符号反転された前記修正離散コサイン変換係数に対して、高速フーリエ変換を利用した逆修正離散サイン変換を実行することで前記残差信号の前記直交ミラーフィルタ係数の虚数成分を算出する逆サイン変換部と、
    前記残差信号の前記直交ミラーフィルタ係数の実数成分と前記残差信号の前記直交ミラーフィルタ係数の虚数成分を合成することで前記残差信号の前記直交ミラーフィルタ係数を算出する係数調整部と、
    を有するオーディオ復号装置。
JP2013070385A 2013-03-28 2013-03-28 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 Expired - Fee Related JP6094322B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013070385A JP6094322B2 (ja) 2013-03-28 2013-03-28 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
EP14162329.8A EP2784776B1 (en) 2013-03-28 2014-03-28 Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus
US14/229,150 US9632982B2 (en) 2013-03-28 2014-03-28 Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013070385A JP6094322B2 (ja) 2013-03-28 2013-03-28 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置

Publications (2)

Publication Number Publication Date
JP2014195152A JP2014195152A (ja) 2014-10-09
JP6094322B2 true JP6094322B2 (ja) 2017-03-15

Family

ID=50732767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013070385A Expired - Fee Related JP6094322B2 (ja) 2013-03-28 2013-03-28 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置

Country Status (3)

Country Link
US (1) US9632982B2 (ja)
EP (1) EP2784776B1 (ja)
JP (1) JP6094322B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6094322B2 (ja) * 2013-03-28 2017-03-15 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
WO2015184643A1 (zh) * 2014-06-06 2015-12-10 华为技术有限公司 数据整合方法以及装置
CN107622036B (zh) * 2017-09-30 2020-07-21 中国人民解放军战略支援部队航天工程大学 一种基于蚁群优化的多项式相位信号自适应时频变换方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH047976Y2 (ja) 1984-09-27 1992-02-28
JP3185371B2 (ja) * 1991-09-30 2001-07-09 ソニー株式会社 改良dctの順変換計算装置、逆変換計算装置及び改良dctの順変換計算方法
JPH08305684A (ja) 1995-04-28 1996-11-22 Matsushita Electric Ind Co Ltd バタフライ演算装置及び逆離散余弦変換装置
JP2000323993A (ja) * 1999-05-11 2000-11-24 Mitsubishi Electric Corp Mpeg1オーディオレイヤiii復号処理装置およびコンピュータをmpeg1オーディオレイヤiii復号処理装置として機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
JP2002287798A (ja) * 2001-03-23 2002-10-04 Seiko Epson Corp オーディオ復号装置、及びオーディオ復号方法
EP1758326B1 (en) * 2005-08-22 2009-01-21 Panasonic Corporation Combined OFDM and wavelet multi-carrier transceiver
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5299327B2 (ja) * 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
JP5799824B2 (ja) * 2012-01-18 2015-10-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP6089878B2 (ja) * 2013-03-28 2017-03-08 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
JP6094322B2 (ja) * 2013-03-28 2017-03-15 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置

Also Published As

Publication number Publication date
EP2784776B1 (en) 2015-12-30
JP2014195152A (ja) 2014-10-09
US9632982B2 (en) 2017-04-25
EP2784776A1 (en) 2014-10-01
US20140297706A1 (en) 2014-10-02

Similar Documents

Publication Publication Date Title
JP7353427B2 (ja) 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置
CN112735447B (zh) 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
KR101286329B1 (ko) 저 복잡도의 스펙트럼 대역 복제 (sbr) 필터뱅크
RU2691231C2 (ru) Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
JP2015520411A5 (ja)
US11037578B2 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
RU2696952C2 (ru) Аудиокодировщик и декодер
JP5299327B2 (ja) 音声処理装置、音声処理方法、およびプログラム
JPWO2010140350A1 (ja) ダウンミックス装置、符号化装置、及びこれらの方法
JP6094322B2 (ja) 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
JP6089878B2 (ja) 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
JP5949270B2 (ja) オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20090033720A (ko) 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
JP6051621B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
CN105336334B (zh) 多声道声音信号编码方法、解码方法及装置
JP2014160212A (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US20150149185A1 (en) Audio encoding device and audio coding method
JP2015118123A (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170130

R150 Certificate of patent or registration of utility model

Ref document number: 6094322

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees