JP5783395B2 - 信号処理方法およびデバイス - Google Patents

信号処理方法およびデバイス Download PDF

Info

Publication number
JP5783395B2
JP5783395B2 JP2013547798A JP2013547798A JP5783395B2 JP 5783395 B2 JP5783395 B2 JP 5783395B2 JP 2013547798 A JP2013547798 A JP 2013547798A JP 2013547798 A JP2013547798 A JP 2013547798A JP 5783395 B2 JP5783395 B2 JP 5783395B2
Authority
JP
Japan
Prior art keywords
rotation
data
compensation
fixed
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013547798A
Other languages
English (en)
Other versions
JP2014503093A (ja
Inventor
▲徳▼明 ▲張▼
▲徳▼明 ▲張▼
海▲ティン▼ 李
海▲ティン▼ 李
阿里斯・塔勒布
▲剣▼峰 ▲許▼
▲剣▼峰 ▲許▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2014503093A publication Critical patent/JP2014503093A/ja
Application granted granted Critical
Publication of JP5783395B2 publication Critical patent/JP5783395B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Description

本願において、
を、Wa Aと表記するものとする。
本出願は、発明の名称を“SIGNAL PROCESSING METHOD AND DEVICE”として2011年1月10日に中国特許庁に出願された、中国特許出願第201110004032.5号の優先権を主張するものであり、これによりその全体が、参照として組み込まれる。
本発明は、デジタル信号処理技術の分野に関し、特に、信号処理方法およびデバイスに関する。
デジタル通信の分野では、音声、画像、オーディオ、およびビデオの送信は、携帯電話通信、オーディオ/ビデオ会議、テレビ放送、およびマルチメディアエンタテイメントのような、非常に広い適用の要求がある。オーディオ/ビデオ信号の保存中または送信中に占有されるリソースを削減するため、オーディオ/ビデオの圧縮符号化技術が出現している。多くの異なる技術のブランチがオーディオ/ビデオ圧縮符号化技術の発達の間に出現しており、時間領域から周波数領域へ信号を変換し、符号化処理を実行する技術もまた、変換領域符号化(transform-domain coding)技術として参照され、所望の圧縮特性を目的として広く適用されている。
時間領域から周波数領域へ信号を変換する多くの方法が変換領域符号化技術において存在し、フーリエ変換(離散フーリエ変換(Discrete Fourier transform:DFT))、離散コサイン変換(Discrete Cosine Transform: DCT)、離散サイン変換(Discrete Sine Transform:DST)、および修正離散コサイン変換(Modified Discrete Cosine Transform:MDCT)のような時間−周波数変換は、特に、スペクトル分析、画像符号化、および音声符号化のような分野において幅広い用途がある。時間−周波数変換された信号は、量子化技術によって圧縮符号化されてよく、また、他のパラメータのオーディオ符号化方法を使用して符号化されてもよく、それにより、データ圧縮の目的を達成する。
しかし、発明者は、変換公式に従って直接DCT−IVまたはMDCT順変換または逆変換を実行することは、高い計算複雑度および記憶量に帰着し、従って、少ない記憶量で時間領域−周波数領域変換方法を早急に提供する必要があることに気付いている。
本発明の態様は、データ処理方法を提供し、オーディオ/ビデオ符号化中の時間領域−周波数領域変換処理の記憶量の削減を目的とする。
本発明の実施形態に従うデータ処理方法は、
回転(twiddle)データを取得するために入力データを回転するステップと、
対称回転係数(symmetric rotate factor)の使用によって回転データを事前回転(pre-rotating)するステップであって、前記回転係数は、a・W2p+1 4Lであって、p=0,…,L/2−1であり、aは定数であるステップと、
事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行するステップであって、Lは入力データの長さであるステップと、
対称回転係数の使用によってFFT変換されたデータを事後回転(post-rotating)するステップであって、回転係数は、b・W2q+1 4Lであって、q=0,…,L/2−1であり、bは定数であるステップと、
出力データを取得するステップとを備える。
本発明の他の実施形態に従う時間領域の周波数領域への信号処理方法は、
前処理されたデータを取得するために時間領域データを前処理するステップと、
回転係数a・Wn+0.5 Nの使用によって前処理されたデータを事前回転するステップと、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するステップと、
周波数領域のデータを取得するために、回転係数b・Wk+0.5 の使用によって離散フーリエ変換されたデータを事後回転するステップとを備え、
周波数領域データを取得するステップの前に、前記方法は、固定回転補償係数の使用によって固定回転補償を実行するステップであって、aおよびbは定数であり、Nは時間領域データの長さであり、
であるステップをさらに備える。
本発明の他の実施形態に従う周波数領域の時間領域への信号処理方法は、
前処理されたデータを取得するために周波数領域データを前処理するステップと、
回転係数c・Wk+0.5 Nの使用によって前処理されたデータを事前回転するステップと、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するステップと、
回転係数d・Wn+0.5 の使用によって高速フーリエ変換されたデータを事後回転するステップと、
時間領域のデータを取得するために、事後回転されたデータを後処理するステップとを備え、
時間領域データを取得するステップの前に、前記方法は、固定回転補償係数の使用によって固定回転補償を実行するステップであって、cおよびdは定数であり、Nは周波数領域データの長さの2倍であり、
であるステップをさらに備える。
本発明の他の実施形態に従う信号処理デバイスは、
回転データを取得するために入力データを回転させるように構成される回転ユニットと、
対称回転係数の使用によって回転データを事前回転させるように構成され、回転係数は、a・W2p+1 4Lであり、p=0,…,L/2−1であり、aは定数である事前回転ユニットと、
事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行するように構成され、Lは入力データの長さである変換ユニットと、
対称回転係数の使用によってFFT変換されたデータを事後回転するように構成され、回転係数は、b・W2q+1 4Lであり、q=0,…,L/2−1であり、bは定数である、事後回転ユニットと、
出力データを取得するように構成される出力ユニットとを備える。
本発明の他の実施形態に従う時間領域の周波数領域への信号処理デバイスは、
前処理されたデータを取得するために時間領域データを前処理するように構成される前処理ユニットと、
回転係数a・Wn+0.5 Nの使用によって前処理されたデータを事前回転するように構成される事前回転ユニットと、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニットと、
周波数領域のデータを取得するために、回転係数b・Wk+0.5 の使用によって離散フーリエ変換後、データを事後回転するように構成される事後回転ユニットとを備え、前記信号処理デバイスは、
固定回転補償係数の使用によって固定回転補償を実行するように構成される固定回転補償ユニットをさらに備え、aおよびbは定数であり、Nは時間領域データの長さであり、
である。
本発明の他の実施形態に従う周波数領域の時間領域への信号処理デバイスは、
前処理されたデータを取得するために周波数領域データを前処理するように構成される前処理ユニットと、
回転係数c・Wk+0.5 の使用によって前処理されたデータを事前回転するように構成される事前回転ユニットと、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニットと、
回転係数d・Wn+0.5 の使用によって高速フーリエ変換されたデータを事後回転するように構成される事後回転ユニットとを備え、前記信号処理デバイスは、
固定回転補償係数の使用によって固定回転補償を実行するように構成される固定回転補償ユニットをさらに備え、cおよびdは定数であり、Nは周波数領域データの長さの2倍であり、
である。
本発明の態様において、事前回転、または事後回転のステップで使用される回転係数は、対称性を有し、それにより、データの記憶量を削減する。同時にFFTは、前記変換の速度を加速するとともに、計算複雑度の削減が可能である。
本発明の実施形態に従った技術的解決策、または先行技術をより明確に説明するために、以下に実施形態、または先行技術を説明する添付の図面が簡潔に導入される。明確に、以下の説明において、添付の図面は、本発明の単なるいくつかの実施形態であり、当業者であれば添付の図面から、他の図面を創造的な努力なしに導き出すことが可能である。
図1は、本発明で提供される時間領域の周波数領域へのDCT−IV変換方法の実施形態の模式的フローチャートである。 図2は、本発明で提供される時間領域の周波数領域へのDCT−IV変換方法の別の実施形態の模式的フローチャートである。 図3は、本発明で提供される時間領域の周波数領域へのDCT−IV変換方法の別の実施形態の模式的フローチャートである。 図4は、本発明で提供される時間領域の周波数領域へのMDCT変換方法の実施形態の模式的フローチャートである。 図5は、本発明で提供される周波数領域の時間領域へのMDCT変換方法の実施形態の模式的フローチャートである。 図6は、本発明で提供される時間領域の周波数領域へのMDCT変換方法の別の実施形態の模式的フローチャートである。 図7は、本発明で提供される周波数領域の時間領域へのMDCT変換方法の別の実施形態の模式的フローチャートである。 図8は、本発明で提供される信号処理デバイスの実施形態の模式的構造図である。 図9は、本発明で提供される時間領域の周波数領域への信号処理デバイスの実施形態の模式的構造図である。 図10は、本発明で提供される周波数領域の時間領域への信号処理デバイスの実施形態の模式的構造図である。
本発明の技術的解決策が添付の図面を参照して以下で明確に、かつ完全に説明される。説明される実施形態は本発明の実施形態の全てというよりはむしろほんの一部であることは自明である。創造的な努力なしに本発明の実施形態に基づいて当業者が獲得した他の全ての実施形態は、本発明の保護範囲に含まれるべきである。
デジタル信号処理の分野において、オーディオコーデックおよびビデオコーデックは、携帯電話、無線デバイス、パーソナルデータアシスタント(PDA)、ハンドヘルドまたはポータブルコンピュータ、GPS受信/ナビゲーションデバイス、カメラ、オーディオ/ビデオプレーヤ、ビデオカメラ、ビデオレコーダ、またはモニタ装置のような様々な電子装置において広く適用されている。一般的に、前記電子装置はオーディオ符号化器またはオーディオ復号化器を備え、前記オーディオ符号化器または復号化器は、DSP(デジタル信号プロセッサ)のようなデジタル回路またはチップによって直接的に実施されてもよく、プロセッサをソフトウェアコードで処理を実行するように駆動するソフトウェアコードによって実施されてもよい。
例えば、オーディオ符号化器がある。オーディオ符号化器は、最初にフレームあたり20msの時間領域データを取得するために入力信号のフレーム処理を実行し、ウィンドウ処理された(windowed)信号を取得するために時間領域データのウィンドウ処理(windowing)を実行し、時間領域信号から周波数領域信号に信号を変換するために、例えば、MDCT変換またはDCT−IV変換のようなウィンドウ化された時間領域信号の周波数領域変換を実行し、帯域分割された周波数領域信号を取得するために周波数領域信号の帯域分割処理を実行し、各副帯域(sub-band)信号のエネルギーを計算し、副帯域のエネルギーの量子符号化(quantization coding)を実行し、復号化器に送信する。次に、各副帯域の量子符号化のためのビット数を取得するために、量子化された副帯域のエネルギーに従って、聴覚マスキング効果(auditory masking effect)に基づいて、自己適応型ビット割り当て(self-adaptive bit allocation)を実行し、最後に、各副帯域における周波数ポイントで正規化処理を実行し、ベクトル量子化技術を用いて、割り当てられた符号化のためのビット数に従って、ベクトル量子化されたコードブックのインデックスを取得して符号化し、かつ復号化器に送信するために、正規化処理された副帯域における周波数ポイントのベクトル量子化を実行する。符号化器から送信された圧縮されたコードストリームを受信後、復号化器は、対応する復号化ステップに従ってコードストリームから各副帯域信号のエネルギーのコードブックのインデックスを探索し、各副帯域信号のエネルギーの量子化値を取得し、各副帯域のために割り当てられたビット数を取得するために、量子化値に従って符号化器に合わせたビット割り当て技術を採用し、各副帯域に割り当てられたビット数と、各副帯域の量子化後、コードストリームから取得された各副帯域のベクトル量子化のコードブックのインデックスとに従って、正規化周波数領域係数を取得し、完全な周波数領域信号を取得するために、各副帯域のエネルギーの量子化値に従って、各副帯域の量子化後、正規化周波数領域係数の非正規化(denormalization)処理を実行し、復号化によって取得された周波数領域信号の符号化器によって使用される変換に対応する逆変換を採用することによって周波数領域から時間領域へ信号を変換し、コンポジット信号、すなわち復号化器の出力信号を取得するために、時間領域信号を後処理(post-process)する。時間領域の周波数領域への信号処理方法は、順変換(forward transform)として参照されてもよく、周波数領域の時間領域への信号処理方法は、逆変換(inverse transform)として参照されてもよい。
DCTは、空間変換として、エネルギー圧縮(energy compaction)を有するという最大の特徴を有し、その結果、DCTに基づく符号化システムは所望の圧縮性能を有する。タイプ4 DCT(DCT−IV)は、オーディオおよびビデオデータ圧縮に頻繁に使用される。DCT−IV変換の式は、
であり、ここでkは0〜L−1の整数である。変換式に従った直接的なDCT−IV順変換および逆変換の実行は、高い計算複雑度および大きな記憶量をもたらすことが理解可能である。DCT−IV変換はリアルタイム通信の分野、特にオーディオ符号化で広く適用されており、DCT−IV変換方法の記憶量の削減は、早急に必要となる。
図1を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するため、符号化手順中で時間領域の周波数領域へのDCT−IV変換を実施するために使用される。本方法は、以下のステップを含む。
S101:回転データを取得するために、時間領域データを回転する。
DCT−IV変換を要求するデータを、
と仮定すると、前記データは、ウィンドウ処理のような前処理ステップを経たデータであってもよい。回転データz(p)を取得するため、データ
を回転する。
S102:対称回転係数の使用によって回転データを事前回転する。ここで、回転係数はa・W2p+1 4Lであり、p=0,1,2,…,L/2−1であり、aは定数である。
回転データz(p) を事前回転する。ここで、回転係数はa・W2p+1 4Lである。また、p=0,1,2,…,L/2−1である。また、
であり、aは定数である。
前記回転係数におけるW2p+1 4Lは、以下の形式で表現されてもよい。
ここで、
の条件を満足し、従って特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S103:事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行する。
S104:対称回転係数の使用によりFFT変換されたデータを事後回転する。ここで回転係数は、b・W2q+1 4Lであって、q=0,…,L/2−1であり、bは定数である。
FFT変換されたデータを事後回転する。ここで、回転係数はb・W2q+1 4Lである。また、q=0,…,L/2−1である。すなわち、qは0〜L/2−1の間の整数である。また、
で、bは定数である。
前記回転係数におけるW2q+1 4Lは、以下の形式で表現されてもよい。
従って、特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
順変換における2つの回転係数の定数a,bの積と、逆変換における2つの回転係数の定数c,dの積とが2/Lに等しい場合、順変換の出力データは逆変換の入力データとして直接使用され、逆変換の結果は完全な復元、すなわち順変換前のデータを取得するように戻して終了可能である。一般的に、実際の演算において、完全な復元は実施される必要はない。完全な復元を実施するためには、定数a,bの値は、順変換におけるaとbとの積と、逆変換におけるcとdとの積との積が、2/Lに等しくなるように選択される。一実施形態において、aとbとの積は、
に等しい、例えば、
が選択されてもよい。このように、事前回転および事後回転後、L/2のポイントのコサインデータテーブル
だけが保存される必要がある。
S105:周波数領域のデータを取得する。
事後回転されたデータの実数部は、y(2q)として表現され、周波数領域データの奇数番号の周波数であり、事後回転されたデータの虚数部の反数(opposite number)はy(L−1−2q)として表現され、周波数領域データの偶数番号の周波数である。
ここで、
は事後回転されたデータである。
元のDCT−IV変換式
は、
と等価であり、ここで、
である。これは、
と書き換えてもよい。ここで、計算を単純にするため、W-1 4Lは1と近似であると解釈してよく、W-1 8Lは1と近似であると解釈してよい。
ここで、
である。
回転係数W2q+1 4Lは、対称であり、すなわち、W2q+1 4Lは、
を満たす。
同様に、回転係数W2p+1 4Lもまた、対称性を満足する。
本実施形態において、事前回転および事後回転のステップで使用される回転係数は対称性を有する。実施中、データ記憶量を削減するために、L/2のポイントのコサインテーブル、またはL/2のポイントのサインテーブルだけがW2q+1 4Lのために保存される必要がある。同時に、FFTを使用して、DCT−IV変換速度を加速するとともに、計算複雑度を削減してもよい。さらに、変換が復元特性を満足する状況において、固定回転のステップをスキップすることで計算複雑度をさらに削減してもよい。
他の実施形態において、周波数領域データの取得の前に、本方法は、固定回転補償係数の使用によって固定回転補償を実行するステップをさらに含んでもよい。変換式において、固定回転補償および他の部分の演算は乗算関係であり、そのため固定回転補償は、乗算の交換法則(communicative property of multiplication)に従って、1回または2回以上実行されてもよく、周波数領域データの取得前、固定回転補償の実行順序は、どのような順序であってもよい。
一実施形態において、W-3 8Lは、固定回転補償を1回実行するために使用され、固定回転補償を実行するステップは、事前回転の前または後で実行されてよく、かつ事後回転の前または後で実行されてもよい。前記補償が1回実行されると、固定回転補償係数は、W-3 8Lであってもよい。計算複雑度をさらに削減するため、いくつかの近似値が固定回転補償を実行するためにW-3 8Lを置換するように使用されてもよい。
であり、従って、近似は、テイラー級数展開(Taylor series expansion)で実行されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4L)がW-3 8Lの近似値として使用されてもよく、ここで1+j(3π/4L)は、実数部、虚数部が、それぞれ1、(3π/4L)である複素数を表現する。
他の実施形態において、固定回転補償が2回実行されると、固定回転補償係数は、W-1 8LおよびW-1 4Lであってもよく、その近似値であってもよい。1回目に実行される固定回転補償の補償係数は、W-1 8LおよびW-1 4Lのいずれか1つであってもよく、2回目に実行される固定回転補償の補償係数は、W-1 8LおよびW-1 4Lの残りの1つであってもよい。1回目に実行される固定回転補償は、事前回転の前または後に実行されてもよく、2回目に実行される固定回転補償は、事後回転の前または後に実行されてもよい。計算複雑度をさらに削減するために、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-1 8LまたはW-1 4Lを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(π/4L)がW-1 8Lの近似値として使用されてもよく、一次テイラー級数展開の結果1+j(π/2L)がW-1 4Lの近似値として使用されてもよい。
明らかに、乗算の交換法則により、固定回転補償は3回またはそれ以上実行されてもよく、補償係数の積はW-3 8Lであるか、または、少なくとも1つの補償係数は、積がW-3 8Lである少なくとも1つの係数の近似値である。固定回転補償の係数は、1であってもよい。
本実施形態において、固定回転補償のステップが追加され、その結果、変換後に取得されたデータが、元のDCT−IV変換後に取得されたデータと一致することが保証され、それによりDCT−IV変換の精度を改良する。
さらに、DCT−IV逆変換は、逆変換において、周波数領域データが最初に回転され、時間領域データが最後の変換後に取得され、回転係数における定数aおよびbが定数cおよびdに変更されることだけを除き、順変換と実質的に同じステップを有する。
図2を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、時間領域の周波数領域へのDCT−IV変換を実施するために使用される。本方法は、以下のステップを含む。
S201:回転データを取得するため、時間領域データを回転する。
DCT−IV変換を要求するデータを、
と仮定すると、前記データは、ウィンドウ処理のような前処理ステップを経たデータであってもよい。回転データz(p)を取得するため、データ
を回転する。
S202:対称回転係数の使用によって回転データを事前回転する。ここで、回転係数はa・W2p+1 4Lであり、p=0,1,2,…,L/2−1であり、aは定数である。
回転データz(p) を事前回転する。ここで、回転係数はa・W2p+1 4Lである。また、p=0,1,2,…,L/2−1である。また、
であり、aは定数である。
前記回転係数におけるW2p+1 4Lは、以下の形式で表現されてもよい。
ここで、
の条件を満足し、従って特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S203:1回目の固定回転補償を実行する。
事前回転されたデータの固定回転補償を実行し、固定回転補償係数は、W-1 8Lである。計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-1 8Lを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(π/4L)が固定回転補償を実行するために、W-1 8Lの近似値として使用される。
S204:固定回転補償を受けたデータのL/2のポイントのFFT変換を実行する。
S205:2回目の固定回転補償を実行する。
FFT変換を受けたデータは、固定回転補償を実行するために、W-1 4Lと乗算されるか、またはFFT変換を受けたデータは、固定回転補償を実行するために、W-1 4Lの近似値と乗算される。前記近似値は、W-1 4Lのテイラー級数展開の使用によって取得されてもよい。例えば、一次テイラー級数展開の結果1+j(π/2L)がW-1 4Lの近似値として使用されてもよい。
S206:対称回転係数の使用により固定回転補償を受けたデータを事後回転する。ここで回転係数は、b・W2q+1 4Lであって、q=0,1,2,…,L/2−1である。また、
であり、bは定数である。
前記回転係数におけるW2q+1 4Lは、以下の形式で表現されてもよい。
従って、特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
完全な復元を実行するためには、定数a,bの値は、順変換における2つの回転係数aとbとの積と、逆変換における2つの回転係数cとdとの積との積が、2/Lに等しくなるように選択される。一実施形態において、aとbとの積は、
に等しく、cとdとの積もまた、
に等しい。別の実施形態において、aとbとの積は1に等しく、cとdとの積は2/Lに等しい。別の実施形態において、
が選択され、このように、事前回転および事後回転後、L/2のポイントのコサインデータテーブル
だけが保存される必要がある。
S207:変換された周波数領域データを取得する。
事後回転されたデータの実数部は、y(2q)として表現され、周波数領域データの奇数番号の周波数であり、事後回転されたデータの虚数部の反数はy(L−1−2q)として表現され、周波数領域データの偶数番号の周波数である。
ここで、
または、
は事後回転されたデータである。
-1 8Lの使用により固定回転補償を実行するステップは、事前回転の後に実行されてもよいだけではなく、事前回転の前に実行されてもよく、W-1 4Lの使用により固定回転補償を実行するステップは、事後回転の前に実行されてもよいだけではなく、事後回転の後に実行されてもよいことに留意すべきである。さらに、変換式において、2回実行された固定回転補償および他の部分の演算は、乗算関係であり、そのため、乗算の交換法則が適用可能であり、従ってW-1 8Lの使用により固定回転補償を実行するステップは、W-1 4Lの使用により固定回転補償を実行するステップと交換されてもよい。
本実施形態において、2回固定回転補償を実行するステップが実行され、その結果、FFTの入力データが、元のDCT−IV変換におけるFFTの入力データと一致することが保証され、変換後に取得されるデータが、元のDCT−IV変換後に取得されたデータと一致することもまた保証され、それによりDCT−IV変換の精度を改良する。
さらに、DCT−IVの逆変換は、逆変換において、周波数領域データが最初に回転され、時間領域データが最後の変換後に取得され、回転係数における定数aおよびbが定数cおよびdに変更されることだけを除き、順変換と実質的に同じステップを有する。
図3を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、時間領域の周波数領域へのDCT−IV変換を実施するために使用される。本方法は、以下のステップを含む。
S301:回転データを取得するため、時間領域データを回転する。
DCT−IV変換を要求するデータを、
と仮定すると、前記データは、ウィンドウ処理のような前処理ステップを経たデータであってもよい。回転データz(p)を取得するため、データ
を回転する。
S302:対称回転係数の使用によって回転データを事前回転する。ここで、回転係数はa・W2p+1 4Lであり、p=0,1,2,…,L/2−1であり、aは定数である。
回転データz(p)を事前回転する。ここで、回転係数はa・W2p+1 4Lである。また、p=0,1,2,…,L/2−1である。また、
で、p=0,1,2,…,L/2−1であり、aは定数である。
前記回転係数におけるW2p+1 4Lは、以下の形式で表現されてもよい。
ここで、
の条件を満足し、従って特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S303:事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行する。
S304:固定回転補償を実行する。
FFT変換を受けたデータは、固定回転補償を実行するために、W-3 8Lと乗算されるか、またはFFT変換を受けたデータは、固定回転補償を実行するために、W-3 8Lの近似値と乗算され、前記近似値は、W-3 8Lのテイラー級数展開の使用によって取得されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4L)がW-3 8Lの近似値として使用されてもよい。
S305:対称回転係数の使用により固定回転補償を受けたデータを事後回転する。ここで回転係数は、b・W2q+1 4Lであって、q=0,1,2,…,L/2−1である。また、
であり、bは定数である。
前記回転係数におけるW2q+1 4Lは、以下の形式で表現されてもよい。
従って、特定の実施において、L/2のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
完全な復元を実行するためには、定数a,bの値は、順変換における2つの回転係数の定数aとbとの積と、逆変換における2つの回転係数の定数cとdとの積との積が、2/Lに等しくなるように選択される。一実施形態において、aとbとの積は、
に等しい。別の実施形態において、
が選択され、このように、事前回転および事後回転後、L/2のポイントのコサインデータテーブル
だけが保存される必要がある。
S306:周波数領域データを取得する。
事後回転されたデータの実数部は、y(2q)として表現され、周波数領域データの奇数番号の周波数であり、事後回転されたデータの虚数部の反数はy(L−1−2q)として表現され、周波数領域データの偶数番号の周波数である。
ここで、
または、
または、
または、
は事後回転されたデータである。
本実施形態における固定回転補償を実行するステップは、事後回転の前に実行されてもよいだけではなく、事前回転の前、またはFFT変換の前、または、事後回転の後に実行されてもよい。変換式において、固定回転補償および他の部分の演算は、乗算関係であり、乗算の交換法則も適用可能である。
本実施形態において、固定回転補償を実行するステップが追加され、その結果、変換後に取得されたデータが、元のDCT−IV変換後に取得されたデータと一致することが保証され、それによりDCT−IV変換の精度を改良する。
DCT−IVの逆変換は、逆変換において、周波数領域データが入力であり、時間領域データが出力であることだけを除き、順変換と同様のステップを有する。従って、前述の実施形態において、DCT−IVの逆変換の実施形態は、入力データと出力データとが、周波数領域データと時間領域データとへ、それぞれ変わるときに構成される。さらに、DCT−IVの逆変換及び順変換は、固定回転補償の実行の順序が異なってもよい。例えば、順変換において、固定回転補償は事後回転後に実行され、逆変換において、固定回転補償は事前回転の前に実行される。
オーディオ/ビデオ符号化において、MDCT変換もまた、「境界効果(boundary effect)」を緩和するために時間領域エイリアシングキャンセレーション(time domain aliasing cancellation:TDAC)技術を採用しているため、広く適用されている。MDCT変換式は、
であり、ここでAは正規化係数で、Aは定数である。前記変換式に従ってMDCT順変換および逆変換を直接的に実行することは、特により大きなポイントのMDCT変換で高い計算複雑度および記憶量に帰着することがわかる。MDCT変換は、リアルタイム通信の分野、特にオーディオ符号化で広く適用されており、高速なMDCT変換手法もまた早急に必要となる。
図4を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、時間領域の周波数領域へのMDCT変換を実施するために使用される。本方法は、以下のステップを含む。
S401:前処理されたデータを取得するため、時間領域データを前処理する。
MDCT変換を要求するデータを、yと仮定すると、前記データは、ウィンドウ処理のような処理ステップを経たデータであってもよい。回転データuを取得するため、データyを回転する。
ここで、
または、以下のように表現される。
S402:対称回転係数の使用によって前処理されたデータを事前回転する。ここで、回転係数はa・Wn+0.5 Nであり、n=0,1,2,…,N/4−1である。
回転データuを事前回転する。ここで、回転係数はa・Wn+0.5 Nであり、n=0,1,2,…,N/4−1である。また、
で、aは定数である。
前記回転係数におけるWn+0.5 Nは、以下の形式で表現されてもよい。
ここで、
および
の条件を満足し、従って特定の実施において、N/4のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S403:1回目の固定回転補償を実行する。
事前回転されたデータの固定回転補償を実行し、固定回転補償係数は、W-0.375 Nである。計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-0.375 Nを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4N)が固定回転補償を実行するために、W-0.375 Nの近似値として使用されてもよい。
S404:固定回転補償を受けたデータのN/4のポイントのFFT変換を実行する。
S405:2回目の固定回転補償を実行する。
FFT変換を受けたデータは、固定回転補償を実行するために、W-0.375Nと乗算されるか、またはFFT変換を受けたデータは、固定回転補償を実行するために、W-0.375Nの近似値と乗算され、前記近似値は、W-0.375Nのテイラー級数展開の使用によって取得されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4N)がW-0.375Nの近似値として使用されてもよい。
S406:対称回転係数の使用により固定回転補償を受けたデータを事後回転する。ここで回転係数は、b・Wk+0.5 Nであって、k=0,1,2,…,N/4−1である。また、
であり、bは定数である。
前記回転係数におけるWk+0.5 Nは、以下の形式で表現されてもよい。
従って、特定の実施において、N/4のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S407:周波数領域データを取得する。
事後回転されたデータの実数部は、X2として表現され、周波数領域データの奇数番号の周波数であり、事後回転されたデータの虚数部の反数はXN/2−1−2kとして表現され、周波数領域データの偶数番号の周波数である。
周波数領域データ、すなわち最終スペクトルは、X、k=0,1,2,…,N/2−1であり、
または、
として表現される。
-0.375 Nの使用により1回目に固定回転補償を実行するステップは、事前回転の後に実行されてもよいだけではなく、事前回転の前に実行されてもよく、W-0.375 Nの使用により2回目に固定回転補償を実行するステップは、事後回転の前に実行されてもよいだけではなく、事後回転の後に実行されてもよいことに留意すべきである。
変換式において、固定回転補償および他の部分の演算は、乗算関係であり、乗算の交換法則も適用可能であり、固定回転補償は、1回または2回以上実行されてもよく、周波数領域データの取得前、固定回転補償の実行順序は、どのような順序であってもよい。補償係数の積は、W-0.75 Nまたは、積がW-0.75 Nである少なくとも1つの係数の近似値である。
本実施形態において、対称性を有する回転係数を採用することで、記憶量を削減でき、改良前の方法の記憶量はN/2のポイントであり、改良後の方法の記憶量はN/4のポイントである。固定回転補償を実行するステップが追加され、それによりMDCT変換の精度を改良し、その結果、変換後に取得されたデータが、元のMDCT変換後に取得されたデータと一致することが保証される。
N/4のポイントのFFTに基づくMDCT高速変換の元の式は、
であり、これは、
のように書き換えられ、ここで、
である。
改良された回転係数が対称性の特徴を有する、すなわち、Wn+0.5 N
を満たすことを証明することは容易である。
同様に、Wk+0.5 Nもそのような対称性を満たす。
対称性の特徴は、記憶量を削減するために使用されてもよい。実施中、N/4のポイントのコサインテーブルまたはN/4のポイントのサインテーブルだけが、Wn+0.5 Nのために保存される必要があり、W-0.375 Nの固定回転補償はN/4のポイントのFFT変換を実行する前に実行され、かつW-0.375 Nの固定回転補償はN/4のポイントのFFT変換を実行した後に実行される。変換が完全に復元されることは証明可能である。
計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-0.375 Nを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4N)がW-0.375 Nの近似値として使用されてもよい。
図5を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、周波数領域の時間領域へのMDCT変換を実施するために使用される。本方法は、以下のステップを含む。
S501:回転データを取得するため、周波数領域データを回転する。
データの回転後に取得される中間変数(intermediate variable)は、X2k+jXN/2−1−2kであり、ここで、k=0,1,2,…,N/4−1である。
S502:対称回転係数の使用により回転データを事前回転する。
回転データX2k+jXN/2−1−2kを事前回転する、ここで回転係数は、c・Wk+0.5 Nであり、ここで、k=0,1,2,…,N/4−1である。また、
であり、cは定数である。
S503:1回目の固定回転補償を実行する。
事前回転されたデータの固定回転補償を実行し、固定回転補償係数は、W-0.375 Nである。計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-0.375 Nを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4N)が固定回転補償を実行するために、W-0.375 Nの近似値として使用されてもよい。
S504:固定回転補償を受けたデータのN/4のポイントのFFT変換を実行する。
S505:2回目の固定回転補償を実行する。
FFT変換を受けたデータは、固定回転補償を実行するために、W-0.375 Nと乗算されるか、またはFFT変換を受けたデータは、固定回転補償を実行するために、W-0.375 Nの近似値と乗算され、前記近似値は、W-0.375 Nのテイラー級数展開の使用によって取得されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/4N)がW-0.375 Nの近似値として使用される。
S506:対称回転係数の使用により固定回転補償を受けたデータを事後回転する。
固定回転後のデータを事後回転する。ここで回転係数は、d・Wn+0.5 Nであって、n=0,1,2,…,N/4−1である。また、
であり、dは定数である。
S507:時間領域データを取得する。
時間領域データ
を取得する。
ここで、
である。
完全な復元を実行するためには、定数a,b,c,dの値は、順変換におけるaとbとの積と、逆変換におけるcとdとの積との積が、4/Nに等しくなるように選択される。本実施形態において、
が選択され、従って、N/4のポイントのコサインデータテーブル
だけが保存される必要がある。
同様に、W-0.375 Nの使用により1回目に固定回転補償を実行するステップは、事前回転の後に実行されてもよいだけではなく、事前回転の前に実行されてもよく、W-0.375 Nの使用により2回目に固定回転補償を実行するステップは、事後回転の前に実行されてもよいだけではなく、事後回転の後に実行されてもよい。乗算の交換法則により、固定回転補償は3回またはそれ以上実行されてもよく、補償係数の積は、W-0.75 Nまたは、積がW-0.75 Nである少なくとも1つの係数の近似値である。
本実施形態において、固定回転補償を2回行うステップが採用され、それによりMDCT変換の精度を改良し、その結果、変換後に取得されたデータが、元のMDCT変換後に取得されたデータと一致することが保証される。
図6を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、時間領域の周波数領域へのMDCT変換を実施するために使用される。本方法は、以下のステップを含む。
S601:前処理されたデータを取得するため、時間領域データを前処理する。
MDCT変換を要求するデータを、yと仮定すると、前記データは、ウィンドウ処理のような処理ステップを経たデータであってもよい。回転データuを取得するため、データyを回転する。
ここで、
または、
として表現される。
S602:対称回転係数の使用によって前処理されたデータを事前回転する。ここで、回転係数はa・Wn+0.5 Nであり、n=0,1,2,…,N/4−1である。
回転データuを事前回転する。ここで、回転係数はa・Wn+0.5 Nであり、n=0,…,N/4−1である。また、
で、aは定数である。
前記回転係数におけるWn+0.5 Nは、以下の形式で表現されてもよい。
ここで、
および
の条件を満足し、従って、特定の実施において、N/4のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S603:固定回転補償を実行する。
事前回転されたデータの固定回転補償を実行し、ここで固定回転補償係数は、W-0.75 Nである。計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-0.75 Nを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/2N)が固定回転補償を実行するために、W-0.75 Nの近似値として使用されてもよい。
S604:固定回転補償を受けたデータのN/4のポイントのFFT変換を実行する。
S605:対称回転係数の使用によりFFT変換されたデータを事後回転する。
FFT変換されたデータを事後回転する。ここで、回転係数はb・Wk+0.5 Nであり、k=0,1,2,…,N/4−1である。また、
であり、bは定数である。
前記回転係数におけるWk+0.5 Nは、以下の形式で表現されてもよい。
従って、特定の実施において、N/4のポイントのコサインデータテーブル
または、サインデータテーブル
の1つだけが保存される必要がある。
S606:周波数領域データを取得する。
事後回転されたデータの実数部は、X2として表現され、周波数領域データの奇数番号の周波数であり、事後回転されたデータの虚数部の反数はXN/2−1−2kとして表現され、周波数領域データの偶数番号の周波数である。
周波数領域データ、すなわち最終スペクトルは、X、k=0,1,2,…,N/2−1であり、
または、
として表現される。
本実施形態における固定回転補償を実行するステップは、事前回転の後に実行されてもよく、事前回転の前に実行されてもよく、事後回転の前、または事後回転の後に実行されてもよいことに留意すべきである。変換式において、固定回転補償および他の部分の演算は、乗算関係であり、乗算の交換法則も適用可能である。
図7を参照すると、本発明の実施形態で提供される信号処理方法が、変換における記憶量を削減するために、符号化手順中に、周波数領域の時間領域へのMDCT変換を実施するために使用される。本方法は、以下のステップを含む。
S701:回転データを取得するため、周波数領域データを回転する。
データの回転後に取得される中間変数は、X2k+jXN/2−1−2kであり、ここで、k=0,1,2,…,N/4−1である。
S702:対称回転係数の使用により回転データを事前回転する。
回転データ(X2k+jXN/2−1−2k)を事前回転する。ここで回転係数は、c・Wk+0.5 Nで、k=0,1,2,…,N/4−1である。また、
であり、cは定数である。
S703:固定回転補償を実行する。
事前回転されたデータの固定回転補償を実行し、固定回転補償係数は、W-0.75 Nである。計算複雑度をさらに削減するため、テイラー級数展開のようないくつかの近似値が固定回転補償を実行するためにW-0.75 Nを置換するように使用されてもよい。例えば、一次テイラー級数展開の結果1+j(3π/2N)が固定回転補償を実行するために、W-0.75 Nの近似値として使用されてもよい。
S704:固定回転補償を受けたデータのN/4のポイントのFFT変換を実行する。
S705:対称回転係数の使用によりFFT変換されたデータを事後回転する。
FFT変換されたデータを事後回転する。ここで回転係数は、d・Wn+0.5 Nで、n=0,1,2,…,N/4−1である。また、
であり、dは定数である。
S706:時間領域データを取得する。
時間領域データ
を取得する。
ここで、
である。
完全な復元を実行するために、定数a,b,c,dの値は、順変換におけるaとbとの積と、逆変換におけるcとdとの積との積が、4/Nに等しくなるように選択される。本実施形態において、
が選択され、従って、N/4のポイントのコサインデータテーブル
だけが保存される必要がある。
同様に、本実施形態における固定回転補償を実行するステップは、事前回転の後に実行されてもよく、または事前回転の前に実行されてもよく、事後回転の前、または事後回転の後に実行されてもよい。変換式において、固定回転補償および他の部分の演算は、乗算関係であり、乗算の交換法則も適用可能である。
当業者は、本発明の実施形態に従う方法の処理の全てまたは一部が、関連するハードウェアに命令するコンピュータプログラムによって実施されてもよいことを理解すべきである。前記プログラムは、コンピュータ読み取り可能な記録媒体に保存されてもよい。プログラムが実行されるとき、本発明の実施形態に従う方法の処理が実行される。前記記録媒体は磁気ディスク、光ディスク、リードオンリーメモリ(Read-Only Memory:ROM)、またはランダムアクセスメモリ(Random Access Memory:RAM)であってもよい。
前述の方法の実施形態に相互関連する図8を参照すると、本発明の信号処理デバイスの実施形態は、
回転データを取得するために入力データを回転させるように構成される回転ユニット801と、
対称回転係数の使用によって回転データを事前回転させるように構成され、回転係数は、a・W2p+1 4Lで、p=0,…,L/2−1であり、aは定数である事前回転ユニット802と、
事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行するように構成され、Lは入力データの長さである変換ユニット803と、
対称回転係数の使用によってFFT変換されたデータを事後回転するように構成され、回転係数は、b・W2q+1 4Lで、q=0,…,L/2−1であり、bは定数である、事後回転ユニット804と、
出力データを取得するように構成される出力ユニット805とを備える。
信号処理デバイスは、符号化/復号化処理において、時間領域の周波数領域への、または周波数領域の時間領域へのDCT−IV変換を実施するために使用されてもよい。順変換において、入力データは時間領域データで、出力データは周波数領域データであり、逆変換において、入力データは周波数領域データで、出力データは時間領域データである。
他の実施形態において、信号処理デバイスは、固定回転補償係数の使用によって固定回転補償を実行するように構成された、固定回転補償ユニットをさらに備える。
一実施形態において、固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償の回転補償係数の積はW-3 8Lである。
他の実施形態において、固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償の回転補償係数が、積がW-3 8Lである少なくとも1つの係数の一次テイラー級数展開である。
復元を満足するために、aとbとの積は、
に等しく、一実施形態において、例えば、
である。
本発明において提供される時間領域の周波数領域への信号処理デバイスの実施形態は、変換における記憶量を削減するために、符号化処理において時間領域の周波数領域へのMDCT変換を実施するために使用される。図9を参照すると、前記信号処理デバイスは、
前処理されたデータを取得するために時間領域データを前処理するように構成される前処理ユニット901と、
回転係数a・Wn+0.5 Nの使用によって前処理されたデータを事前回転するように構成される事前回転ユニット902と、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニット903と、
周波数領域のデータを取得するために、回転係数b・Wk+0.5 の使用によって離散フーリエ変換されたデータを事後回転するように構成される事後回転ユニット904とを備え、前記デバイスは、
固定回転補償係数の使用によって固定回転補償を実行するように構成された、固定回転補償ユニット905をさらに備える。ここで、aとbとは定数であり、Nは時間領域の長さであり、
である。
一実施形態において、前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償の回転補償係数の積はW-0.75 Nである。
別の実施形態において、前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償の回転補償係数は、積がW-0.75 Nである少なくとも1つの係数の一次テイラー級数展開である。
本発明において提供される周波数領域の時間領域への信号処理デバイスの実施形態は、変換における記憶量を削減するために、符号化処理において周波数領域の時間領域へのMDCT変換を実施するために使用される。図10を参照すると、前記信号処理デバイスは、
回転データを取得するために周波数領域データを回転するように構成される回転ユニット1001と、
回転係数c・Wk+0.5 の使用によって回転データを事前回転するように構成される事前回転ユニット1002と、
事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニット1003と、
回転係数d・Wn+0.5 の使用によって高速フーリエ変換されたデータを事後回転するように構成される事後回転ユニット1004とを備え、前記デバイスは、
固定回転補償係数の使用によって固定回転補償を実行するように構成される固定回転補償ユニット1005をさらに備える。ここで、cおよびdは定数であり、Nは周波数領域データの長さの2倍であり、
である。
一実施形態において、前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償の回転補償係数の積はW-0.75 である。
別の実施形態において、前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、少なくとも1回の固定回転補償は、積がW-0.75 Nである少なくとも1つの係数の一次テイラー級数展開である。
本明細書において開示された実施形態に相互関連する記載における、例示的な論理ブロック、モジュール、および回路は、以下のデバイス、ユニバーサルプロセッサ、またはデジタル信号プロセッサ(DSP)、または特定用途向け集積回路(ASIC)、またはフィールドプログラマブルゲートアレイ(FPGA)、またはその他のプログラム可能な論理デバイス、個別のゲートまたはトランジスタロジック、または個別のハードウェアコンポーネント、または、前述の記載部分における機能を実施するために設計されたいかなる組み合わせを使用して構成、または実施されてもよい。前記ユニバーサルプロセッサは、マイクロプロセッサであってもよく、代替的に前記プロセッサは、一般的なプロセッサ、またはコントローラ、またはマイクロコントローラ、またはステートマシンであってもよい。前記プロセッサは、例えば、DSPとマイクロプロセッサとの組み合わせ、または複数のマイクロプロセッサの組み合わせ、または1つまたは2つ以上のマイクロプロセッサとDSPコアとの組み合わせ、または他のそのような構成の組み合わせのうち1つ、のようなコンピューティングデバイスの組み合わせとして構成されてもよい。
801 回転ユニット
802 事前回転ユニット
803 変換ユニット
804 事後回転ユニット
805 出力ユニット
901 前処理ユニット
902 事前回転ユニット
903 変換ユニット
904 事後回転ユニット
905 固定回転補償ユニット
1001 回転ユニット
1002 事前回転ユニット
1003 変換ユニット
1004 事後回転ユニット
1005 固定回転補償ユニット

Claims (13)

  1. 回転(twiddle)データを取得するために入力データを回転するステップと、
    対称回転係数(symmetric rotate factor)の使用によって前記回転データを事前回転(pre-rotating)するステップであって、前記回転係数は、a・W2p+1 4Lであって、p=0,…,L/2−1であり、aは定数であり、
    であるステップと、
    前記事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行するステップであって、Lは入力データの長さであるステップと、
    対称回転係数の使用によってFFT変換されたデータを事後回転(post-rotating)するステップであって、前記回転係数は、b・W2q+1 4Lであって、q=0,…,L/2−1であり、bは定数であり、
    であるステップと、
    出力データを取得するステップと
    を備えるデータ処理方法。
  2. 前記出力データを取得するステップの前に、固定回転補償(fixed rotate compensation)係数の使用によって固定回転補償を実行するステップをさらに備える、請求項1に記載の方法。
  3. 前記固定回転補償係数の使用によって前記固定回転補償を実行するステップは、
    少なくとも1回の固定回転補償を実行するステップであって、前記少なくとも1回の固定回転補償の回転補償係数が、積(product)がW-3 8Lである少なくとも1つの係数の一次テイラー級数展開(first order Taylor series expansion)であるステップを備える、請求項2に記載の方法。
  4. 前記固定回転補償係数の使用によって前記固定回転補償を実行するステップは、
    少なくとも1回の固定回転補償を実行するステップであって、前記少なくとも1回の固定回転補償の回転補償係数の積がW-3 8Lであるステップを備える、請求項2に記載の方法。
  5. aとbとの積が、
    に等しい、請求項1に記載の方法。
  6. 回転データを取得するために入力データを回転させるように構成される回転ユニットと、
    対称回転係数の使用によって前記回転データを事前回転させるように構成され、前記回転係数は、a・W2p+1 4Lであり、p=0,…,L/2−1であり、aは定数であり、
    である事前回転ユニットと、
    前記事前回転されたデータのL/2のポイントの高速フーリエ変換(Fast Fourier Transform:FFT)を実行するように構成され、Lは前記入力データの長さである変換ユニットと、
    対称回転係数の使用によってFFT変換されたデータを事後回転するように構成され、前記回転係数は、b・W2q+1 4Lであり、q=0,…,L/2−1であり、bは定数であり、
    である、事後回転ユニットと、
    出力データを取得するように構成される出力ユニットと
    を備える信号処理デバイス。
  7. 固定回転補償係数の使用によって固定回転補償を実行するように構成される、固定回転補償ユニットをさらに備える、請求項に記載のデバイス。
  8. 前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、前記少なくとも1回の固定回転補償の回転補償係数が、積がW-3 8Lである少なくとも1つの係数の一次テイラー級数展開である、請求項に記載のデバイス。
  9. 前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、前記少なくとも1回の固定回転補償の回転補償係数の積がW-3 8Lである、請求項に記載のデバイス。
  10. aとbとの積が、
    に等しい、請求項に記載のデバイス。
  11. 周波数領域の時間領域への信号処理デバイスであって、
    回転データを取得するために周波数領域データを回転するように構成される回転ユニットと、
    回転係数c・Wk+0.5 の使用によって前記回転データを事前回転するように構成される事前回転ユニットと、
    前記事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニットと、
    回転係数d・Wn+0.5 の使用によって高速フーリエ変換されたデータを事後回転するように構成される事後回転ユニットとを備え、前記信号処理デバイスは、
    固定回転補償係数の使用によって固定回転補償を実行するように構成される固定回転補償ユニットをさらに備え、前記cおよびdは定数であり、前記Nは前記周波数領域データの長さの2倍であり、
    であり、
    前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、前記少なくとも1回の固定回転補償の回転補償係数が、積がW -0.75 である少なくとも1つの係数の一次テイラー級数展開である、信号処理デバイス。
  12. 周波数領域の時間領域への信号処理デバイスであって、
    回転データを取得するために周波数領域データを回転するように構成される回転ユニットと、
    回転係数c・W k+0.5 の使用によって前記回転データを事前回転するように構成される事前回転ユニットと、
    前記事前回転されたデータのN/4のポイントの高速フーリエ変換を実行するように構成される変換ユニットと、
    回転係数d・W n+0.5 の使用によって高速フーリエ変換されたデータを事後回転するように構成される事後回転ユニットとを備え、前記信号処理デバイスは、
    固定回転補償係数の使用によって固定回転補償を実行するように構成される固定回転補償ユニットをさらに備え、前記cおよびdは定数であり、前記Nは前記周波数領域データの長さの2倍であり、
    であり、
    前記固定回転補償ユニットは、少なくとも1回の固定回転補償を実行するように構成され、前記少なくとも1回の固定回転補償の回転補償係数の積がW-0.75 である、信号処理デバイス。
  13. 請求項1〜のいずれか1項に記載の方法をコンピュータに実行させることが可能なプログラムが記録された、コンピュータ読み取り可能な記録媒体。
JP2013547798A 2011-01-10 2011-12-31 信号処理方法およびデバイス Expired - Fee Related JP5783395B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110004032.5A CN102592601B (zh) 2011-01-10 2011-01-10 一种信号处理方法和装置
CN201110004032.5 2011-01-10
PCT/CN2011/085197 WO2012094952A1 (zh) 2011-01-10 2011-12-31 一种信号处理方法和装置

Publications (2)

Publication Number Publication Date
JP2014503093A JP2014503093A (ja) 2014-02-06
JP5783395B2 true JP5783395B2 (ja) 2015-09-24

Family

ID=46481138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013547798A Expired - Fee Related JP5783395B2 (ja) 2011-01-10 2011-12-31 信号処理方法およびデバイス

Country Status (6)

Country Link
US (3) US9519619B2 (ja)
EP (2) EP3518121A1 (ja)
JP (1) JP5783395B2 (ja)
KR (1) KR101627900B1 (ja)
CN (1) CN102592601B (ja)
WO (1) WO2012094952A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324465A (zh) * 2013-05-10 2013-09-25 刘保国 多变量、复杂控制系统的并行算法及结构
CN104392727A (zh) * 2014-11-12 2015-03-04 华为技术有限公司 音频信号处理方法和相关装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6098088A (en) * 1995-11-17 2000-08-01 Teracom Ab Real-time pipeline fast fourier transform processors
US5845241A (en) * 1996-09-04 1998-12-01 Hughes Electronics Corporation High-accuracy, low-distortion time-frequency analysis of signals using rotated-window spectrograms
JP2001296343A (ja) * 2000-04-11 2001-10-26 Nec Corp 音源方位設定装置及びそれを備えた撮像装置、送信システム
US20050015420A1 (en) * 2003-07-18 2005-01-20 Gibb Sean G. Recoded radix-2 pipeline FFT processor
US7685220B2 (en) * 2005-12-14 2010-03-23 Telefonaktiebolaget L M Ericsson (Publ) Circular fast fourier transform
CN101202043B (zh) * 2007-12-28 2011-06-15 清华大学 音频信号的编码方法和装置与解码方法和装置
EP2332072A1 (en) * 2008-09-10 2011-06-15 Co-operative Research Centre For Advanced Automotive Technology Ltd. Method and device for computing matrices for discrete fourier transform (dft) coefficients
CN101354700B (zh) * 2008-09-16 2010-08-11 四川虹微技术有限公司 一种蝶形运算fft处理器
JP2010124324A (ja) * 2008-11-20 2010-06-03 Mitsubishi Electric Corp 受信装置
US8694570B2 (en) * 2009-01-28 2014-04-08 Arun Mohanlal Patel Method and apparatus for evaluation of multi-dimensional discrete fourier transforms
CN101521649B (zh) * 2009-03-25 2012-04-25 吕正德 可配置变换长度dft的频域补偿方法及装置
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101930426B (zh) 2009-06-24 2015-08-05 华为技术有限公司 信号处理方法、数据处理方法及装置

Also Published As

Publication number Publication date
CN102592601B (zh) 2014-09-17
EP2664995A1 (en) 2013-11-20
CN102592601A (zh) 2012-07-18
WO2012094952A1 (zh) 2012-07-19
EP2664995A4 (en) 2015-01-21
US9792257B2 (en) 2017-10-17
US20170075860A1 (en) 2017-03-16
US20170364479A1 (en) 2017-12-21
EP3518121A1 (en) 2019-07-31
JP2014503093A (ja) 2014-02-06
KR20130116904A (ko) 2013-10-24
US9996503B2 (en) 2018-06-12
US20130304784A1 (en) 2013-11-14
US9519619B2 (en) 2016-12-13
KR101627900B1 (ko) 2016-06-07

Similar Documents

Publication Publication Date Title
KR101202729B1 (ko) 신호 처리 방법과 데이터 처리 방법 및 장치
KR101226094B1 (ko) 5-포인트 dct-ⅱ, dct-ⅳ, 및 dst-ⅳ 및 아키텍쳐들의 계산을 위한 고속 알고리즘들
TWI633539B (zh) 從高階保真立體音響信號之係數領域表示產生該高階保真立體音響信號之混合空間或係數領域表示之方法及裝置
EP2863388B1 (en) Bit allocation method and device for audio signal
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
CN106847297B (zh) 高频带信号的预测方法、编/解码设备
JP6121551B2 (ja) オーディオ信号のビットを割り当てる方法及び装置
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
JP5783395B2 (ja) 信号処理方法およびデバイス
CN112397086A (zh) 语音关键词检测方法、装置、终端设备和存储介质
Hsu et al. Autoregressive modeling of temporal/spectral envelopes with finite-length discrete trigonometric transforms
CN113179354B (zh) 声音信号处理方法、装置和电子设备
CN117133307A (zh) 低功耗单声道语音降噪方法、计算机装置及计算机可读存储介质
Kaur et al. Data Compression using Multiple Transformation Techniques for Audio Applications

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140916

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141212

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150707

R150 Certificate of patent or registration of utility model

Ref document number: 5783395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

LAPS Cancellation because of no payment of annual fees
R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350