JP2014514605A - 低周波数エフェクトチャネルのための複雑さが低減された変換 - Google Patents

低周波数エフェクトチャネルのための複雑さが低減された変換 Download PDF

Info

Publication number
JP2014514605A
JP2014514605A JP2014502622A JP2014502622A JP2014514605A JP 2014514605 A JP2014514605 A JP 2014514605A JP 2014502622 A JP2014502622 A JP 2014502622A JP 2014502622 A JP2014502622 A JP 2014502622A JP 2014514605 A JP2014514605 A JP 2014514605A
Authority
JP
Japan
Prior art keywords
transform
real
transformation
audio signal
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014502622A
Other languages
English (en)
Other versions
JP5762620B2 (ja
Inventor
シー フェラーズ,マシュー
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2014514605A publication Critical patent/JP2014514605A/ja
Application granted granted Critical
Publication of JP5762620B2 publication Critical patent/JP5762620B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

限定的帯域幅のオーディオ信号に対して変換ベースフィルタバンクを適用するのに必要とされる計算リソースは、実数の入力データを複素数のデータに合成し、複素数のデータに短い変換を適用する統合された処理を実行し、統合された処理の出力に極めて短い変換のバンクを適用し、この極めて短い変換のバンクの出力から実数の出力データのシーケンスを導出することによって低減される。

Description

本出願は、その全体が参照することによりここに援用される、2011年3月28日に出願された米国特許仮出願第61/468,373号に対する優先権を主張する。
本発明は、一般にデジタル信号処理に関し、より詳細には、より少ない計算リソースを利用して、いわゆる、低周波数エフェクト(LFE)チャネルなどの限定的な帯域幅のオーディオチャネルにフィルタバンクを適用するのに利用されてもよい方法及び装置に関する。
マルチチャネルオーディオ符号化システムを実現するのに利用されてもよい方法及びシステムを規定するため、複数の国際的、地域的及び国家的規格が開発されてきた。このような規格の3つの具体例は、“MPEG−2 AAC”としても知られるISO/IEC 13818−7,Advanced Audio Coding(AAC)、ISO(International Standards Organization)により公開された“MPEG−4 audio”としても知られるISO/IEC 14496−3,subpart 4、及び“Dolby Digital”又は“AC−3”としても知られる2005年6月14日に公開された“Digital Audio Compression Standard(AC−3,E−AC−3)”というタイトルのDocument A/52Bの米国のATSC(Advanced Television System Committee)により公開された規格を含む。
上述されたものなどの規格に準拠するオーディオシステムは、一般に入力オーディオ信号の複数のチャネルのそれぞれに解析フィルタバンクを適用し、解析フィルタバンクの出力を符号化信号に処理し、符号化信号を送信又は記録する送信機と、符号化信号を受信し、これを復号化し、元の入力オーディオ信号の複製である出力オーディオ信号のチャネルを生成するため、合成フィルタバンクを復号化信号に適用する受信機とを含む。規格の多くは、Princen,Johnson,and Bradley,“Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”,ICASSP 1987 Conf.Proc.,May 1987,pp.2161−64に記載されるMDCT(Modified Discrete Transform)及びIMDCT(Inverse Modified Discrete Transform)による解析及び合成フィルタバンクの実現を規定する。
これら特定の変換により実現されるフィルタバンクは、多数の魅力的な性質を有するが、必要とされる計算を実行するのに多くの処理又は計算リソースが要求される。変換をより効率的に実行するのに利用可能な技術が知られ、これにより、必要とされる計算リソース量を低減することができる。これらの技術に共通する1つの特性は、これらの計算複雑性が、いわゆる、変換の長さより変化することである。より短い変換の長さを用いて、オーディオチャネルをより狭い帯域幅により処理することによって、計算複雑性のさらなる低減を実現できる技術が知られている。
上述されたものと同様の規格は、1以上のオーディオチャネルの符号化表現を表現するデータを搬送するデジタルデータシーケンス又はデジタルビットストリームを規定する。“5.1チャネル”として呼ばれることもあるチャネルの1つのコンフィギュレーションは、左(L)、右(R)、中央(C)、左サラウンド(LS)及び右サラウンド(RS)と呼ばれる5つのフル帯域幅のチャネルと、1つの限定的な帯域幅のチャネル又は低周波数エフェクト(LFE)チャネルとを含む。フル帯域幅チャネルは、典型的には、約20kHzの帯域幅を有し、限定的帯域幅のLFEチャネルは、典型的には、約100〜200Hzの帯域幅を有する。LFEチャネルの帯域幅はより狭いため、フル帯域幅チャネルの1つに対して実行可能なものより、LFEチャネルについてより効率的にフィルタバンク変換を実行するのに利用可能である。
にもかかわらず、LFEチャネルなどの限定的帯域幅のチャネルに適用される変換フィルタバンクの効率性をさらに向上させる技術を開発する必要がある。
本発明の課題は、既知の技術を利用して可能なものより効率的に限定的帯域幅のチャネルのフィルタバンクを実現する変換を実行するのに利用可能な方法を提供することである。
本発明の一態様によると、限定的帯域幅の信号が、L個の係数のみが限定的帯域幅のオーディオ信号のスペクトル成分を表すK個の実数変換係数のブロックを受信し、1/2L<M<Kであり、Mは2の冪乗であり、限定的帯域幅のオーディオ信号のスペクトル成分を表すL個の実数変換係数を含むM個の複素数変換係数から導出される複素数係数のブロックに対して長さRの第1変換を適用し、R=M/Pであり、Pは2の冪乗であり、第1変換の出力に対して長さPのQ個の第2変換のバンクを適用し、第2変換のバンクの出力からN個の実数信号サンプルのシーケンスを導出することによって処理され、N=2・Kであり、実数信号サンプルは限定的帯域幅のオーディオ信号の時間成分を表す。
本発明及びその好適な実施例の各種特徴は、同様の参照番号が複数の図面において同様の要素を参照する添付した図面と以下の説明とを参照することによって、より良好に理解されてもよい。以下の説明及び図面の内容は、単なる一例として提供され、本発明の範囲に対する限定を表すと理解されるべきでない。
図1は、本発明の各種態様が実行可能なオーディオ符号化システムの概略的なブロック図である。 図2は、図1に示される符号化システムにおいて合成変換を実行するのに利用されてもよい処理の概略的なブロック図である。 図3は、図2に示される処理の一部を実行するのに利用されてもよいいくつかの特徴を示す概略的なブロック図である。 図4は、図2に示される処理の一部を実行するのに利用されてもよいいくつかの特徴を示す概略的なブロック図である。 図5は、本発明による各種態様を実現するのに利用されてもよい装置の概略的なブロック図である。
A.イントロダクション
図1は、送信機100と受信機200とを有する2チャネルオーディオ符号化システムの概略図である。送信機100は、パス11,12から入力オーディオ信号の2つのチャネルを受信する。解析フィルタバンク111,112は、入力オーディオ信号のスペクトルコンテンツを表現する第1周波数サブバンド信号セットを取得するため、入力オーディオチャネルに適用される。これらの解析フィルタバンクは、時間領域から周波数領域への変換により実現される。エンコーダ120は、パス20に沿ってわたされる符号化情報を生成するため、第1周波数サブバンド信号セットに符号化処理を適用する。受信機200は、パス20から符号化情報を受信する。デコーダ220は、第2周波数サブバンド信号セットを取得するため、符号化情報に復号化処理を適用する。合成フィルタバンク231,232は、パス31,32に沿ってわたされる出力オーディオ信号の2以上のチャネルを生成するため、第2周波数サブバンド信号セットに適用される。これらの合成フィルタバンクは、周波数領域から時間領域への変換により実現される。パス20は、符号化情報を搬送又は記録可能なブロードキャスト媒体、ポイント・ツー・ポイント通信媒体、記録媒体又は他の何れかの媒体であってもよい。
エンコーダ120とデコーダ220とは、本発明を実現するのに必須ではない。それらが利用される場合、それらは、可逆又は不可逆符号化処理を実行してもよい。本発明は、何れか特定の符号化及び復号化処理に限定されるものでない。
説明の簡単化のため、入力及び出力オーディオチャネルの2つのチャネルのみが図面に示される。多くの実現形態では、2より多くの入力オーディオ信号のチャネルと、2より多くの出力オーディオ信号のチャネルとがある。出力オーディオ信号の少なくとも1つは、その他の出力オーディオ信号の1以上の帯域幅よりはるかに狭い帯域幅を有する。
本発明は、より狭い帯域幅の出力オーディオ信号を生成するのに利用される受信機200において合成フィルタバンク231又は232を実現する変換を実行するのに必要とされる計算リソースを低減することに関する。本発明は、既存の送信機100における解析フィルタバンクとの互換性を維持する受信機200におけるより効率的な合成フィルタバンクを実現可能である。
本発明はまた、より狭い帯域幅の入力オーディオ信号に適用される送信機100における解析フィルタバンク111又は112を実現する変換を実行するのに必要とされる計算リソースを低減するのに利用されてもよい。この実現は、既存の受信機200における合成フィルタバンクとの互換性を維持することが可能である。
B.実現技術
合成フィルタバンクは、上述された逆離散コサイン変換(IDCT)及び逆修正離散コサイン変換(IMDCT)の多数の変形を含む広範な周波数領域から時間領域への変換により実現可能である。これらの変換を直接的に規定するアルゴリズムは、“ダイレクト変換”と呼ばれる。
“フォールディング(folding)技術”とここでは呼ばれる1つの技術は、これらのダイレクト変換をより効率的に実行するのに利用可能である。フォールディング技術は、図2に示されるような3つの段階を有する。第2段階402は、当該フォールディング技術が実現するダイレクト変換より短い長さを有する変換を実行する。第2段階402において実行される変換は、以下の説明がダイレクト変換とより容易に区別できるように、“フォールディッド変換(folded transform)”と呼ばれる。
プリプロセッサ段階401は、K個の実数周波数領域変換のブロックにおける変換係数を1/2K個の複素数変換係数のブロックに合成する。変換段階402は、1/2K個の複素数時間領域サンプルを生成するため、複素数変換係数のブロックに対して、1/2Kの長さの周波数領域から時間領域へのフォールディッド変換を適用する。ポストプロセッサ段階403は、1/2K個の複素数時間領域信号サンプルからK個の実数時間領域サンプルのシーケンスを導出する。有限精度算出演算から生じうる何れかの誤差を除き、当該技術により取得されるK個の時間領域信号サンプルは、K個の実数周波数領域変換係数のブロックに対して長さKのダイレクト変換を適用することによって取得可能なK個の時間領域信号サンプルと同じである。段階402におけるフォールディッド変換に反対するダイレクト変換を実行するのに必要とされる追加的な計算リソースは、プリプロセッサ段階401及びポストプロセッサ段階403において実行される処理を実現するのに必要とされる計算リソースより大きいため、当該技術は効率性を向上させる。
変換係数のブロックが、有意な個数の変換係数が常にゼロになる狭帯域幅信号を表す場合、段階402において実行されるフォールディッド変換の処理効率を向上させるため、追加的な変換分解技術が利用されてもよい。
当該技術は、以下のセクションにおいて説明される。
1.ダイレクト変換
ダイレクトIMDCTが、式2に示される。それの補完的な修正離散コサイン変換(MDCT)が、式1に示される。
Figure 2014514605
ただし、X(k)=実数周波数領域変換係数k、K=実数周波数領域変換係数の総数、x(n)=実数時間領域信号サンプルn、及びN=サンプルの時間領域ウィンドウの長さ(ただし、N=2K)である。
これらのダイレクト変換の適切な処理は、当該技術において周知な要件を充足する長さ及び形状を有する解析ウィンドウ機能と合成ウィンドウ機能との利用を要求する。解析ウィンドウ機能は、MDCTの適用前にN個の入力オーディオ信号サンプルのセグメントに適用される。合成ウィンドウ機能は、K個の変換係数のブロックに対するIMDCTの適用から取得されるN個のサンプルのセグメントに適用され、これらウィンドウ化されたサンプルのセグメントは、他の変換係数ブロックから取得されるウィンドウ化されたサンプルセグメントと重複及び追加される。さらなる詳細は、上述されたPrincenらによる論文から取得されてもよい。以下のパラグラフは、解析ウィンドウ機能のさらなる説明を省略している。
2.フォールディッド技術
プリプロセッサ段階401において実行される処理は、
Figure 2014514605
として表現されてもよく、ここで、X’(k)=複素数周波数領域変換係数kであり、j=√−1に等しい虚数演算子である。
変換段階402において実行されるフォールディッド変換は、
Figure 2014514605
として表現されてもよく、ここで、
Figure 2014514605
であり、x’(n)=複素数時間領域信号サンプルである。
ポストプロセッサ段階403において実行される処理は、
Figure 2014514605
として表現されてもよく、ここで、y(n)=以降のウィンドウ化処理に利用される中間サンプル値、Re[x’(n)]=複素数x’(n)の実部、及びIm[x’(n)]=複素数x’(n)の虚部である。
3.IMDCTの合成ウィンドウ機能
IMDCTの適切な処理は、適切に設計された合成ウィンドウ機能を変換により生成される時間領域サンプルに適用することを含む。当該ウィンドウ化処理から取得される時間領域信号サンプルは、
Figure 2014514605
として表現されてもよく、ここで、h(n)=合成ウィンドウ機能のポイントnであり、y’(n)=ウィンドウ化された中間サンプルnである。
式6から取得されるウィンドウ化された中間サンプルy’は、周波数領域変換係数ブロックXに対するダイレクトIMDCTの適用と、その後の合成ウィンドウ機能hの適用とによって取得可能な中間時間領域サンプルである。上述されたPrincenの論文に説明されるように、出力時間領域信号サンプルは、以前の変換係数ブロックから導出される“以前”のウィンドウ化された仮のサンプルセットにより“現在”の変換係数ブロックから導出されるウィンドウ化された仮のサンプルを重複及び追加することによって取得される。この重複・追加(overlap−add)処理は、
Figure 2014514605
として表現されてもよく、ここで、y’prev(n)=以前のウィンドウ化された仮のサンプルである。
4.変換分解技術
変換分解技術は、周波数領域変換係数ブロックの変換係数の一部がゼロに等しいと知られる限定的帯域幅信号についてフォールディッド変換を実行するためのより効率的な方法を導出するのに利用されてもよい。この分解技術は、フォールディッド変換を等価な2次元変換として表現し、当該2次元変換を1次元垂直変換と、その後の1次元水平方向の逆離散フーリエ変換(IDFT)のバンクに分解することから構成される。垂直変換はQに等しい長さを有し、水平コンプレックスIDFTのバンクは、各変換がPに等しい長さを有するQ個の変換を有し、ここで、P及びQは整数であり、PとQとの積はフォールディッド変換の長さに等しい。
フォールディッド技術の上記の説明を参照して、フォールディッド変換の長さはJ=1/4・N=1/2Kであり、すなわち、P・Q=Jであることが理解されてもよい。P,Q及びJの各値は、2の冪乗に制限される。
水平方向IDFT及び垂直変換はそれぞれ、式8及び9に示される。
Figure 2014514605
垂直変換の変換カーネルWN/4は、オイラーの法則を用いて計算されてもよい。
Figure 2014514605
ダイレクト変換係数X(k)は限定的な帯域幅のLFEチャネルによりオーディオ信号を表現するため、これらの係数のL個しかゼロ以外の値を有することはできない。ここで、LはKよりかなり小さい。この結果、プリプロセッサ段階401から取得される複素数周波数領域変換係数X’(k)の
Figure 2014514605
のみがゼロ以外の値を有し、垂直変換の長さが低減されてもよい。
Figure 2014514605
の当該数以上の最小の2の冪乗となるように、Mの値が選択され、フォールディッド処理は、非ゼロの値を有することが可能なL個の実数のダイレクト変換係数を含むM個の複素数の周波数領域変換係数X’(k)を導出するため修正される。これらのM個の複素数の周波数領域変換係数は、変換段階402により処理される。垂直変換のサイズRは、R=M/Pとなるように選ばれる。変換係数X’(P・r+p)は、Pr+p≧2R又はr≧Rについてゼロである。これらを考慮することによって、式9は、
Figure 2014514605
として記述できる。
5.統合されたプリプロセッサ及び垂直変換
上述された変換分解技術と組み合わされるフォールディッド技術の効率性は、式9に示されるような垂直変換とプリプロセッサ段階401とを1つの処理に統合することによってさらに向上させることができる。これは、図3に概略的に示される。
垂直変換の長さRは、Mの値に等しいか、又はMの値の2の冪乗の約数となるよう選択されてもよい。上述されたAC−3に準拠する実施例では、実数の周波数領域変換係数の1/2・Nの数は256に等しく、LFEチャネルのオーディオ信号のスペクトルコンテンツは、7つの実数の変換係数X(k)により表現できる(ただし、0≦k≦7)。プリプロセッサ段階401は、7つの実数の変換係数を、J=1/4・N=128の長さのフォールディッド変換により以降に処理される4つの複素数変換係数にフォールドする。この結果、本実施例において4つの複素数変換係数が与えられると、Mは4に等しく、Rは1,2又は4に等しいPを設定することによって、それぞれ4,2又は1に等しく設定できる。P・Q=Jであるため、水平変換の長さQは、Pが1、2及び4に等しいとき、それぞれ128,64及び32に等しい。Pが1に等しいとき、効率性のゲインはほとんど又は全く実現されない。
Pが2に等しく設定されると、垂直変換の出力から取得される値は、各水平変換において計算される少数個の係数が与えられると、ビット反転される必要はない。Cooley−Tukey FFTアルゴリズムの変換インデックスのビット反転の必要性は周知である。ビット反転は、Pが2に等しく設定されているときは不要である。これは、長さ2のコンプレックスDFTのビット反転は、ビット反転を実行しないことによって実現される同じ係数インデックス処理を生じさせるためである。この計算の効果は、実行すべきより多くの水平変換を有することによってオフセットされる。P及びQの値は、処理を実現するのに選ばれるハードウェアにおける処理制約などの各種設計考慮点に応じて選択されてもよい。
式3に示される処理と式9に示される垂直変換との統合は、式3及び10に従ってそれぞれ式9のX’(k)と、
Figure 2014514605
との置換を行うことによって導出可能である。これらの置換は、垂直変換について以下のカーネル関数を生じさせる。
Figure 2014514605
式12のサイン及びコサインの項の相互の積は、
Figure 2014514605
として書き換え可能である。
Figure 2014514605
が成り立つことが理解され、以下の式を簡単化するため、これをI(s,n)として表す。この表記を利用して、式11は、
Figure 2014514605
として書き換えられてもよい。
複素乗算を実行して、
Figure 2014514605
を取得できる。
関数U(n,p)の計算複雑さは、周波数領域係数X(v)が0≦v<2Rに対してのみ非ゼロとなりうる事実を利用することによって、さらに低減できる。この低減は、当該関数を実部関数U(n,p)及び虚部関数U(n,p)にそれぞれ分割する以下の式に反映される。ただし、U(n,p)=U(n,p)+j・U(n,p)であり、
Figure 2014514605
である。
プリプロセッサ段階401と垂直変換との上記統合が、図4に概略的に示される。関数U(n,p)又はその成分関数U(n,p)及びU(n,p)を実現するのに必要とされる計算リソースは、v,u及びnのすべての値に対して関数sin(I(v,n)),cos(I(v,n)),sin(I(u,n))及びcos(I(u,n))を予め計算することによって低減できる。ルックアップテーブルに計算結果を格納することは、4・P・R・Q個のエントリを必要とし、式17のサイン、4の因数はコサイン、v及びuのすべての組み合わせを説明する。
テーブルのサイズは、すべてのnについてI(0,n)=π/4Nが成り立つことを認識することによって、12.5%さらに低減されてもよい。この結果、式17のXのすべての因数について必要とされるエントリの個数は、3.5・P・R・Qのオーダである。
これらのテーブルのサイズが所望されるより大きい場合、そのサイズは、テーブルのI(v,n)のエントリの多くがサイン及びコサインの基底関数の周期性により重複した値を有するという事実を利用することによって、低減可能である。このサイズの低減は、より精緻なインデックス処理スキームがテーブルのデータにアクセスするのに必要とされるため、テーブルのエントリを検索するのに必要とされる追加的な処理リソースと引き換えに実現できる。
テーブルサイズ要求を低減するため他の技術が利用されてもよい。例えば、サイン及びコサインテーブルがある実現形態においてすでに存在する場合、I(v,n)及びI(u,n)のみが必要とされ、これは、2のファクタによりテーブルエントリの個数が低減される。
C.実現形態
本発明の各種態様を含む装置は、汎用コンピュータに見出せるものと類似するコンポーネントに接続されるデジタル信号プロセッサ(DSP)回路など、より特殊なコンポーネントを含むコンピュータ又は他の装置による実行用のソフトウェアを含む各種方法により実現されてもよい。図5は、本発明の態様を実現するのに利用されてもよい装置70の概略的なブロック図である。プロセッサ72は、計算リソースを提供する。RAM73は、処理用にプロセッサ72により利用されるシステムRAM(Random Access Memory)である。ROM74は、装置70を動作させるのに必要なプログラムを格納し、おそらく本発明の各種態様を実行するためのROM(Read Only Memory)などの永続的なストレージの形態を表す。I/Oコントロール75は、通信チャネル76,77を介し信号を送受信するためのインタフェース回路を表す。図示された実施例では、すべての主要なシステムコンポーネントが、複数の物理的又は論理的バスを表してもよいバス71に接続する。しかしながら、バスアーキテクチャは、本発明を実現するのに必要とされない。
汎用コンピュータシステムにより実現される実施例では、追加的なコンポーネントは、キーボードやマウス及びディスプレイなどの装置とインタフェースをとり、磁気テープ若しくはディスク又は光媒体などの記憶媒体を有する記憶装置78を制御するため含まれてもよい。記憶媒体は、オペレーティングシステム、ユーティリティ及びアプリケーションのための命令のプログラムを記録するのに利用されてもよく、本発明の各種態様を実現するプログラムを含むものであってもよい。
本発明の各種態様を実現するのに必要とされる機能は、離散的な論理コンポーネント、集積回路、1以上のASIC及び/又はプログラム制御プロセッサを含む広範な方法により実現されるコンポーネントにより実行可能である。これらのコンポーネントが実現される方法は、本発明にとって重要でない。
本発明のソフトウェア実現形態は、超音波から紫外線周波数を含むスペクトル全体のベースバンド又は変調通信パスなどの広範なマシーン可読媒体、又は磁気テープ、カード若しくはディスク、光カード若しくはディスク及び紙を含む媒体上で検出可能なマーキングを含む実質的に任意の記録技術を利用して情報を搬送する記憶媒体により搬送されてもよい。

Claims (7)

  1. デジタルオーディオ信号を処理する方法であって、
    実数変換係数のブロックを受信するステップであって、前記ブロックはK個の実数変換係数を有し、前記実数変換係数のL個のみが限定的帯域幅のオーディオ信号のスペクトル成分を表し、1/2L<M<Kであり、Mは2の冪乗である、前記受信するステップと、
    前記限定的帯域幅のオーディオ信号のスペクトル成分を表すL個の実数変換係数を含むM個の複素数変換係数から導出される複素数係数のブロックに対して、長さRの第1変換を適用するステップであって、R=M/Pであり、Pは2の冪乗である、前記適用するステップと、
    前記第1変換の出力に対して、長さPのQ個の第2変換のバンクを適用するステップと、
    前記第2変換のバンクの出力からN個の実数信号サンプルのシーケンスを導出するステップであって、N=2・Kであり、前記実数信号サンプルは前記限定的帯域幅のオーディオ信号の時間成分を表す、前記導出するステップと、
    を有する方法。
  2. 前記第2変換のそれぞれは、
    Figure 2014514605
    として表現される計算を実行することに等価であり、
    前記実数信号サンプルのシーケンスは、
    Figure 2014514605
    に等価な計算を実行することによって、前記第2変換のバンクの出力から導出され、ここで、x’は前記第2変換の出力を表し、U(n,p)=前記第1変換のカーネル関数、
    Figure 2014514605
    y(n)は中間信号サンプルを表し、Re[x’(n)]=x’(n)の実部、Im[x’(n)]=x’(n)の虚部、j=√−1に等しい虚数演算子、並びにm,n及びpは計算に用いられるインデックスである、請求項1記載の方法。
  3. 前記第1変換は、
    Figure 2014514605
    として表現される計算を実行することに等価であり、Xは前記実数変換係数を表し、R=M/Pであり、rは計算に用いられるインデックスである、請求項2記載の方法。
  4. 前記第1変換は、
    Figure 2014514605
    として表現される計算を実行することに等価であり、Xは前記実数変換係数を表し、R=M/Pであり、
    Figure 2014514605
    であり、rは計算に用いられるインデックスである、請求項2記載の方法。
  5. 前記第1変換は、
    Figure 2014514605
    として表現される計算を実行することに等価であり、Xは前記実数変換係数を表し、R=M/Pであり、
    Figure 2014514605
    であり、rは計算に用いられるインデックスである、請求項2記載の方法。
  6. 請求項1乃至5何れか一項記載の方法のすべてのステップを実行する手段を有する、デジタルオーディオ信号を処理する装置。
  7. 請求項1乃至5何れか一項記載の方法のすべてのステップを有する、デジタルオーディオ信号を処理する方法を実行するため装置により実行可能な命令のプログラムを記憶した記憶媒体。
JP2014502622A 2011-03-28 2012-03-19 低周波数エフェクトチャネルのための複雑さが低減された変換 Active JP5762620B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161468373P 2011-03-28 2011-03-28
US61/468,373 2011-03-28
PCT/US2012/029603 WO2012134851A1 (en) 2011-03-28 2012-03-19 Reduced complexity transform for a low-frequency-effects channel

Publications (2)

Publication Number Publication Date
JP2014514605A true JP2014514605A (ja) 2014-06-19
JP5762620B2 JP5762620B2 (ja) 2015-08-12

Family

ID=45931032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014502622A Active JP5762620B2 (ja) 2011-03-28 2012-03-19 低周波数エフェクトチャネルのための複雑さが低減された変換

Country Status (20)

Country Link
US (1) US10410644B2 (ja)
EP (1) EP2691951B1 (ja)
JP (1) JP5762620B2 (ja)
KR (1) KR101411297B1 (ja)
CN (1) CN103415883B (ja)
AU (1) AU2012238001B2 (ja)
CA (1) CA2826018C (ja)
CL (1) CL2013002762A1 (ja)
DK (1) DK2691951T3 (ja)
EA (1) EA030776B9 (ja)
ES (1) ES2598827T3 (ja)
HK (1) HK1189699A1 (ja)
HU (1) HUE030185T2 (ja)
IL (1) IL227635A (ja)
MX (1) MX2013011131A (ja)
MY (1) MY166267A (ja)
PL (1) PL2691951T3 (ja)
SG (1) SG193237A1 (ja)
UA (1) UA107293C2 (ja)
WO (1) WO2012134851A1 (ja)

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2888554A (en) 1955-09-06 1959-05-26 Rca Corp Diversity reception
US3900721A (en) 1974-02-14 1975-08-19 Us Navy Serial-access linear transform
US4241411A (en) 1978-11-16 1980-12-23 Probe Systems, Incorporated FFT Parallel processor having mutually connected, multiple identical cards
US4579032A (en) 1984-09-10 1986-04-01 Kawai Musical Instrument Mfg. Co., Ltd Computation time reduction in a polyphonic tone synthesizer
US5394349A (en) 1992-07-10 1995-02-28 Xing Technology Corporation Fast inverse discrete transform using subwords for decompression of information
IL107658A0 (en) 1993-11-18 1994-07-31 State Of Israel Ministy Of Def A system for compaction and reconstruction of wavelet data
US5671168A (en) 1995-07-06 1997-09-23 Technion Research & Development Foundation Ltd. Digital frequency-domain implementation of arrays
US5781728A (en) 1996-03-15 1998-07-14 Motorola Inc. Flexible asymmetrical digital subscriber line ADSL transmitter, remote terminal using same, and method therefor
US5742527A (en) 1996-03-15 1998-04-21 Motorola, Inc. Flexible asymmetrical digital subscriber line (ADSL) receiver, central office using same, and method therefor
US5841890A (en) 1996-05-06 1998-11-24 Northrop Grumman Corporation Multi-dimensional wavelet tomography
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
SE515535C2 (sv) 1996-10-25 2001-08-27 Ericsson Telefon Ab L M En transkoder
SG54383A1 (en) 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
SE9703849L (sv) 1997-03-14 1998-09-15 Ericsson Telefon Ab L M Nedskalning av bilder
US5978647A (en) 1997-07-10 1999-11-02 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating autocorrelation coefficients in a multipath sonar system
US5995803A (en) 1997-07-10 1999-11-30 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating a multipath sonar system
US6002914A (en) 1997-07-10 1999-12-14 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating reverberation in a multipath sonar system
US5983067A (en) 1997-07-10 1999-11-09 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating cross-correlation coefficients in a multipath sonar system
US5978646A (en) 1997-07-10 1999-11-02 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating a lofargram in a multipath sonar system
WO1999012292A1 (en) 1997-08-29 1999-03-11 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Fast synthesis sub-band filtering method for digital signal decoding
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6081783A (en) 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US6847737B1 (en) 1998-03-13 2005-01-25 University Of Houston System Methods for performing DAF data filtering and padding
US6324559B1 (en) 1998-10-16 2001-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Odd-transform fast convolution
US6477553B1 (en) 1999-01-13 2002-11-05 Philip Druck Measurement scale for non-uniform data sampling in N dimensions
US6430529B1 (en) 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6643406B1 (en) 1999-07-28 2003-11-04 Polaroid Corporation Method and apparatus for performing linear filtering in wavelet based domain
AU8027400A (en) 1999-10-28 2001-05-14 Philip Druck Self-stabilizing, portable and efficient computer arithmetic using mappings of dscale points
DE60131152D1 (en) 2000-03-10 2007-12-13 Jaber Associates L L C Paralleles multiprocessing für die fast fourier-transformation mit pipelinearchitektur
US7246143B2 (en) 2000-04-07 2007-07-17 Comsat Corporation Traced fast fourier transform apparatus and method
EP1175030B1 (en) 2000-07-07 2008-02-20 Nokia Siemens Networks Oy Method and system for multichannel perceptual audio coding using the cascaded discrete cosine transform or modified discrete cosine transform
CA2415363C (en) 2000-07-11 2006-01-24 Samsung Electronics Co., Ltd. Repetitive-pn1023-sequence echo-cancellation reference signal for single-carrier digital television broadcast systems
WO2002057901A1 (en) 2001-01-17 2002-07-25 Exxonmobil Upstream Research Company Simulation method and system using component-phase transformations
US7020672B2 (en) 2001-03-30 2006-03-28 Koninklijke Philips Electronics, N.V. Reduced complexity IDCT decoding with graceful degradation
US6993547B2 (en) 2001-05-07 2006-01-31 Jaber Associates, Llc Address generator for fast fourier transform processor
US7366236B1 (en) 2001-06-04 2008-04-29 Cisco Sytems Canada Co. Source adaptive system and method for 2D iDCT
GB2383412B (en) 2001-12-18 2004-06-30 Univ Sheffield Structural health monitoring
US6776760B2 (en) 2002-03-06 2004-08-17 Alfred E. Mann Institute For Biomedical Engineering At The University Of Southern California Multi-mode processing for ultrasonic imaging
US6850589B2 (en) 2002-03-27 2005-02-01 Agilent Technologies, Inc. Tomography of curved surfaces
AU2003257412A1 (en) 2002-04-13 2003-11-11 I-For-T Gmbh Vibration sensor and method for monitoring the condition of rotating components and bearings
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7277493B2 (en) 2003-01-28 2007-10-02 Agere Systems Inc. Equalization in orthogonal frequency domain multiplexing
CN100546233C (zh) 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
US20040230419A1 (en) 2003-05-15 2004-11-18 Divio, Inc. DRAM access for MDCT/IDMCT implementation
US7606138B2 (en) 2003-09-29 2009-10-20 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada Multi-symbol encapsulated OFDM system
EP1711938A1 (en) * 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
US7702002B2 (en) 2004-01-28 2010-04-20 Qualcomm Incorporated Rapid acquisition methods and apparatus for GPS signals
CN1938760B (zh) 2004-04-05 2012-05-23 皇家飞利浦电子股份有限公司 多通道编码器
US7483480B2 (en) 2004-11-24 2009-01-27 Nokia Corporation FFT accelerated iterative MIMO equalizer receiver architecture
BRPI0608756B1 (pt) 2005-03-30 2019-06-04 Koninklijke Philips N. V. Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão
WO2006103581A1 (en) 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
BRPI0608945C8 (pt) 2005-03-30 2020-12-22 Coding Tech Ab codificador de áudio de multi-canal, decodificador de áudio de multi-canal, método de codificar n sinais de áudio em m sinais de áudio e dados paramétricos associados, método de decodificar k sinais de áudio e dados paramétricos associados, método de transmitir e receber um sinal de áudio de multi-canal codificado, mídia de armazenamento legível por computador, e, sistema de transmissão
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
ATE433182T1 (de) 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
US8443026B2 (en) * 2005-09-16 2013-05-14 Dolby International Ab Partially complex modulated filter bank
EP1969901A2 (en) 2006-01-05 2008-09-17 Telefonaktiebolaget LM Ericsson (publ) Personalized decoding of multi-channel surround sound
US8112247B2 (en) 2006-03-24 2012-02-07 International Business Machines Corporation Resource adaptive spectrum estimation of streaming data
CN101411063B (zh) 2006-03-28 2011-11-23 艾利森电话股份有限公司 滤波器自适应频率分辨率
US20070286431A1 (en) 2006-05-25 2007-12-13 Microlink Communications Inc. Headset
US8700387B2 (en) 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
CN101192269B (zh) 2006-11-29 2012-05-02 佳能株式会社 从图像估计消失点的方法和装置、计算机程序及其存储介质
JP5290207B2 (ja) 2007-03-02 2013-09-18 クゥアルコム・インコーポレイテッド スーパーインポーズされた複合チャネルフィルタ
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
US20090141808A1 (en) 2007-11-30 2009-06-04 Yiufai Wong System and methods for improved video decoding
US8497743B2 (en) 2007-12-24 2013-07-30 Telefonaktiebolaget L M Ericsson (Publ) Passive fourier transform circuits and butler matrices
US7907683B2 (en) 2008-04-28 2011-03-15 Newport Media, Inc. Application of superfast algorithms to a pilot-based channel estimation process
US7940864B2 (en) 2008-04-28 2011-05-10 Newport Media, Inc. Channel estimation for high doppler mobile environments
FR2938947B1 (fr) * 2008-11-25 2012-08-17 A Volute Procede de traitement du signal, notamment audionumerique.
US8438204B2 (en) 2008-12-18 2013-05-07 Lsi Corporation Apparatus for calculating an N-point discrete fourier transform
US8787501B2 (en) 2009-01-14 2014-07-22 Qualcomm Incorporated Distributed sensing of signals linked by sparse filtering
EP2237269B1 (en) 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
US9031834B2 (en) * 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
CA2778382C (en) 2009-10-20 2016-01-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
AU2011263191B2 (en) * 2010-06-09 2016-06-16 Panasonic Intellectual Property Corporation Of America Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7014003381; J. P. Princen, A. W. Johnson and A. B. Bradley: 'Subband/transform coding using filter bank designs based on time domain aliasing cancellation' IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP) , 19870406, pp. 2161-2164 *

Also Published As

Publication number Publication date
SG193237A1 (en) 2013-10-30
CL2013002762A1 (es) 2014-03-07
DK2691951T3 (en) 2016-11-14
MY166267A (en) 2018-06-22
HUE030185T2 (en) 2017-04-28
WO2012134851A1 (en) 2012-10-04
CN103415883A (zh) 2013-11-27
JP5762620B2 (ja) 2015-08-12
IL227635A (en) 2017-05-29
MX2013011131A (es) 2013-10-30
UA107293C2 (uk) 2014-12-10
ES2598827T3 (es) 2017-01-30
US10410644B2 (en) 2019-09-10
AU2012238001B2 (en) 2015-09-17
US20140012588A1 (en) 2014-01-09
EP2691951B1 (en) 2016-08-24
EA201370207A1 (ru) 2014-01-30
CA2826018C (en) 2016-05-17
IL227635A0 (en) 2013-09-30
EA030776B9 (ru) 2019-01-31
CN103415883B (zh) 2015-11-25
HK1189699A1 (zh) 2014-06-13
CA2826018A1 (en) 2012-10-04
PL2691951T3 (pl) 2017-03-31
KR20130116914A (ko) 2013-10-24
KR101411297B1 (ko) 2014-06-26
EA030776B1 (ru) 2018-09-28
EP2691951A1 (en) 2014-02-05

Similar Documents

Publication Publication Date Title
US9620132B2 (en) Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
EP2973551B1 (en) Reconstruction of audio scenes from a downmix
CN101882441B (zh) 利用复调制滤波器组的高效滤波
CN110047496B (zh) 立体声音频编码器和解码器
JP2007526691A (ja) 信号解析及び合成のための適応型混合変換
KR20120018324A (ko) 저 복잡도의 스펙트럼 대역 복제 (sbr) 필터뱅크
US8433584B2 (en) Multi-channel audio decoding method and apparatus therefor
US9257129B2 (en) Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus
EP2784776B1 (en) Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus
JP5762620B2 (ja) 低周波数エフェクトチャネルのための複雑さが低減された変換
AU2014314477B2 (en) Frequency band table design for high frequency reconstruction algorithms
TWI470622B (zh) 用於低頻效應頻道降低複雜度之轉換
JP7275217B2 (ja) 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム
AU2012238001A1 (en) Reduced complexity transform for a low-frequency-effects channel
BR112013022988B1 (pt) Método para processar um sinal de áudio digital, aparelho para processar um sinal de áudio digital e meio de armazenamento

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150609

R150 Certificate of patent or registration of utility model

Ref document number: 5762620

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250