JP2010515106A - 重み付けウィンドウを用いた低遅延変換符号化 - Google Patents

重み付けウィンドウを用いた低遅延変換符号化 Download PDF

Info

Publication number
JP2010515106A
JP2010515106A JP2009544424A JP2009544424A JP2010515106A JP 2010515106 A JP2010515106 A JP 2010515106A JP 2009544424 A JP2009544424 A JP 2009544424A JP 2009544424 A JP2009544424 A JP 2009544424A JP 2010515106 A JP2010515106 A JP 2010515106A
Authority
JP
Japan
Prior art keywords
window
frame
samples
sample
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009544424A
Other languages
English (en)
Other versions
JP5247721B2 (ja
Inventor
バラーツ・コヴシー
ダヴィド・ヴィレット
ピーリック・フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR0700056A external-priority patent/FR2911227A1/fr
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2010515106A publication Critical patent/JP2010515106A/ja
Application granted granted Critical
Publication of JP5247721B2 publication Critical patent/JP5247721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、異なる長さのウィンドウを用いて、フレームの連続によって表現されるデジタルオーディオ信号の変換符号化/復号化に関する。本発明による符号化のために、現在のフレーム(T)においてアタックのような特定の事象を検出(51)することが求められ、少なくとも、現在のフレーム(53)の始めにおいて前記特定の事象が検出(53)されると、遷移ウィンドウを適用することなく、現在のフレーム(T)を符号化(56)するために短いウィンドウ(54)が直接に適用される。従って、この符号化は先行技術に対して低減した遅延を有する。さらに、符号化の間の長いウィンドウから短いウィンドウへの直接の移行を補償するために、復号化の間に特別な処理が適用される。

Description

本発明は、デジタルオーディオ信号の符号化/復号化に関する。
データ転送速度低減のための変換符号化方式において、一般に、サンプルの符号化に与えられる正確さを低減することが求められ、一方、それにもかかわらず、聞き手が可能な限り最も低い程度の劣化を認識することを保証することが求められる。
この目的のために、量子化処理によって実行される正確さの低減は、心理音響学モデルを用いて制御される。人間の耳の特性の知識に基づくこのモデルは、最も認識されにくい聴覚周波数において量子化ノイズを調整することを可能とする。
心理音響学モデルからのデータ、本質的に周波数領域におけるデータを使用するために、この周波数領域において実行される量子化とともに、時間/周波数変換を実行することは標準的な習慣である。
図1は、
・入力信号Xに作用する解析フィルタFA1,...,FAnのバンクBA、
・符号化モジュールCODが続く量子化モジュールQ、
・符号化された信号X’を出力する合成フィルタFS1,...,FSnのバンクBS、
を有する変換符号化器の構造を図式的に表わす。
伝送前にデータ転送速度を低減させるために、多くの場合、“エントロピー”(無損失符号化)と呼ばれる符号化を用いて、量子化された周波数サンプルが符号化される。量子化は、一様な、または、一様でない、スカラー量子化器、または、ベクトル量子化器による標準的な仕方で実行される。
量子化ステップにおいて導入されるノイズは、(“逆変換”とも呼ばれる)合成フィルタバンクによって形成される。従って、解析変換と対応付けされた逆変換は、ノイズが聞こえるようになることを防止するために、周波数または時間によって量子化ノイズを効果的に純化させるように選択されなければならない。
解析変換は、変換された領域における容易なサンプル符号化を可能とするために、可能な限り信号エネルギーを純化させなければならない。特に、入力信号に依存する変換符号化利得は、可能な限り最大化されなければならない。この目的のために、
SNR=GTC+K・R
の形の関係式を使用することができ、ここで、Kは定数項であり、その値は好ましくは6.02でありうる。
従って、得られる信号対雑音比(SNR)は、選択されたサンプル毎のビット数(R)に比例し、変換符号化利得を表わす成分GTCが増加される。符号化利得が大きくなるほど、復元の品質が高くなる。
従って、符号化変換の重要さを理解することができる。(解析部による)信号エネルギーおよび(合成部による)量子化ノイズの両方を純化させる機能により、サンプルの容易な符号化を可能とする。
オーディオ信号は非定常(non-stationary)であることがよく知られているので、オーディオ信号の特性の関数として、時間上で時間/周波数変換を採用することが適切である。
標準的な符号化技術への適用を以下で説明する。
変調変換の場合、標準的なオーディオ符号化技術は、コサイン変換または高速フーリエ変換に基づく高速なアルゴリズムを用いてこれらの符号化技術を実現することを可能とするコサイン変調フィルタバンクを組み込む。
この種類の変換の中で、(特に、MP3、MPEG−2、MPEG−4 AAC符号化において)最も一般的に使用される変換は、MDCT(Modified Discrete Cosine Transform)変換である。その式は、0≦k<Mについて、
Figure 2010515106
であり、次の表記を用いる。
・Mは、変換のサイズを表わす。
・xn+tMは、時間n+tMの瞬間に周期1/F(サンプリング周波数の逆数)でデジタル化された音のサンプルである。
・tはフレームのインデックスである。
Figure 2010515106
はフレームtについて変換された領域におけるサンプルである。
Figure 2010515106
は、変換の基底関数(base function)であり、h(n)はサイズ2Mのプロトタイプフィルタと呼ばれる。
初期の時間サンプルを復元するため、サンプル0≦n≦M−1を復元するために、次の逆変換が適用される。
Figure 2010515106
図1aを参照すると、次のように復元が実行される。
・2M個のサンプルを生成する、サンプル
Figure 2010515106
の逆DCT変換(以下、DCT−1と示す)。
・2M個のサンプルを生成する、サンプル
Figure 2010515106
の逆DCT変換。最初のM個のサンプルは前のフレームの最後のM個のフレームと同一の時間をサポートする。
・フレームTの2番目の半分(最後のM個のサンプル)について合成ウィンドウh(M+n)による、および、続くフレームTi+1の最初の半分(最初のM個のサンプル)について合成ウィンドウh(n)による重み付け。
・共通のサポートにおけるウィンドウ化された成分の加算。
条件
Figure 2010515106
による信号の(完全と呼ばれる)正確な復元を保証するために、多数の制約を満たすプロトタイプウィンドウh(n)を選択することが適切である。
完全な復元を可能とするために、典型的に、次の関係式
Figure 2010515106
が十分であり、ウィンドウは中央のサンプルに関して同等の対称性を有する。
これら2つの簡単な制約を満たすことは比較的簡単であり、この目的のために、
Figure 2010515106
と書かれる正弦曲線のウィンドウによって標準的なプロトタイプフィルタが構成される。
もちろん、“Kaiser Bessel Derived”(またはKBD)という名称のMPEG−4標準で定義されたウィンドウ、または、重複の少ないウィンドウのような他の形態のプロトタイプフィルタが存在する。
図1aは、長いウィンドウを用いたMDCT変換による処理の一例を表わす。この図において、
・破線矢印は減算を表わす。
・実線矢印は加算を表わす。
・一点鎖線矢印は、符号化のためのDCT処理、および、復号化DECのためのDCT−1処理を表わし、このDCTは上記の基底関数のコサインの項に対応する。
・符号化される信号のサンプルはフローにおいてxinと表わされ、円で囲まれ、図1bにおいてaおよびb、図1cにおいてeおよびfの符号が付けられた特定のサンプルの符号化/復号化処理の詳述が続く。
・サンプルxinはフレームによってグループ化され、現在のフレームはTと表わされ、前後のフレームはそれぞれTi−1、Ti+1と表わされる。
・符号DECは、(追加の復元を有する合成ウィンドウFSを用いて)復号化器によって実行される処理に関する。
・解析ウィンドウはFAと表わされ、合成ウィンドウはFSと表わされる。
・nは、ウィンドウとウィンドウの中間と、サンプルaの間の距離である。
符号Calc T’は、解析ウィンドウFAを用いて符号化されたフレームT’の計算、および、フレームTi−1およびTのそれぞれのサンプルに関する。これは、図1aに表わされているのは、単に従来の例である。また、例えば、符号化されたフレームT’を計算するために、フレームTおよびTi+1をインデックスするように決定することができる。図1aの例に続いて、符号Calc T’i+1は、フレームTおよびTi+1のそれぞれのサンプルを用いた符号化されたフレームT’i+1の計算に関する。
変換DCTおよび逆変換DCT−1の前に得られたv1およびv2は、
v1=a*h(M+n)+b*h(2*M−1−n)
v2=b*h(M−1−n)−a*h(n)
の形の式を用いて得られる。
従って、全体的なDCT/DCT−1および合成ウィンドウの処理の後、復元の項a’およびb’は、
a’=v1*h(M+n)−v2*h(n)=a*h(M+n)*h(M+n)+b*h(2*M−1−n)*h(M+n)−b*h(M−1−n)*h(n)+a*h(n)*h(n)
b’=v1*h(2*M−1−n)+v2*h(M−1−n)=a*h(M+n)*h(2*M−n−1)+b*h(2*M−1−n−1)*h(2*M−n−1)+b*h(M−1−n)*h(M−1−n)−a*h(n)*h(M−1−n)
と表わされ、従って、(関係式(1)を使用して、かつ、h(M−1−n)=h(n+M)を差し引いて、)復元が完全であること(a’=aおよびb’=b)を検証することが可能である。
上述したMDCT変換の原理は、特に、0≦k<MおよびL=2kM、kは2より大きい正の整数について、
Figure 2010515106
を用いて、基底関数の次数が変換のサイズの2倍より大きいELT(“Extended Lapped Transform”)と呼ばれる変換に自然に拡張される。
復元のために、MDCT変換に関する2つの続くフレームを結合させることに代えて、サンプルの合成は、K個のウィンドウ化された連続したフレームを含む。
さらに、ウィンドウの対称性の制約(後に詳細に説明する原則)は、ELT型の変換のために緩めることが可能であることが示される。また、解析および合成ウィンドウの間の同一性の制約を緩めることが可能であり、双直交(biorthogonal)フィルタを使用することを可能とする。
符号化される信号に変換を適用する必要性を考慮して、先行技術は、“ウィンドウ切り替え”と呼ばれるもの、すなわち、時間にわたって使用される変換のサイズを変更することを可能とする。
ウィンドウの長さを変更する必要性は、特に次の場合に正当化することができる。符号化される信号、例えば音声(speech)信号は、強いアタック(attack)を特徴付ける過渡(非定常)信号(例えば、音声信号における破裂音を特徴付ける“ta”または“pa”の音の発音)を含むとき、符号化の時間の解像度を増加させ、従って、符号化ウィンドウのサイズを減少させることが適切であり、従って、これは長いウィンドウから短いウィンドウに移行することを必要とする。より正確には、先行技術において、移行は、この場合において、長いウィンドウ(後述する図2a)から遷移ウィンドウ(後述する図2c)へ、そして、一連の短いウィンドウ(後述する図2b)へと生じる。従って、後に詳細に理解されるように、現在のフレームの符号化ウィンドウの長さを決定することができ、結果として現在のフレームを符号化する前に、少なくとも1つの続くフレームにおけるアタックを予想することが必要である。
先行技術によるウィンドウ長の変更の一例を以下で説明する。
典型的な例は、MPEG−AAC標準で規定されているように、サイズMのMDCT変換のサイズをサイズM/8に変更することである。
完全な復元の特性を保持するために、上記の式(1)は、2つのサイズの間での遷移のときに次式によって置換されなければならない。
Figure 2010515106
さらに、異なるサイズの続くプロトタイプフィルタのために、0≦n<Mについて関係式
(M+M/2−M/2+n)=h(M−n)
が与えられる。従って、遷移のときにサイズM/2について対称性が存在する。
図2aから図2eには、異なる種類のウィンドウがそれぞれ表わされている。
・図2aは、サイズ2M=512個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2bは、サイズ2M=64個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2cは、サイズ512から64に移行することを可能とする遷移ウィンドウ。
・図2dは、サイズ64から512に移行することを可能とする遷移ウィンドウ。
・図2eは、上述した基本ウィンドウを用いて実行される構成の例。
各々の連続したものは、“ウィンドウ長”と呼ばれるものを定義する予め定められた“長さ”を有する。従って、図1aを参照して示したように、符号化されるサンプルは、少なくとも組に結合され、結合において、それぞれのウィンドウの重み付け値によって重み付けされる。
より詳しくは、正弦曲線ウィンドウ(図2aおよび図2b)は対称的であり、すなわち、ウィンドウを構成する値の連続の中間における中央の値の両側で、重み付け値はほぼ等しい。効果的な実施形態は、これらのウィンドウの重み付け値の変化を定義するために“サイン”関数を選択することからなる。他のウィンドウ選択(例えば、MPEG AACにおいて使用されるもの)も可能である。
しかし、遷移ウィンドウ(図2cおよび図2d)は非対称であり、(PLAと示す)“平坦”な領域を含むことが表わされている。これは、これらの領域における重み付け値が最大であり、例えば“1”に等しいことを意味する。長いウィンドウから短いウィンドウへの遷移ウィンドウ(図1c)を使用して、図1bおよび図1cを参照して分かるように、(図1bに表わされている例における)サンプルaを含む2つのサンプルは係数“1”によって単純に重み付けされ、一方、サンプルbは符号化されたフレームT’の計算において係数“0”によって重み付けされ、それによって、符号化されたフレームT’において、サンプルaを含む2つのサンプルが(DCTを除いて)そのままで単純に送信される。
符号化システムにおける可変サイズの変換の使用を以下で説明する。また、オーディオサンプルを復元するための復号化器に関する処理を説明する。
標準的なシステムにおいて、符号化器は、習慣的に、時間にわたって使用される変換を選択する。従って、AAC標準において、符号化器は、上述した4つのウィンドウサイズ設定のうち1つを選択することを可能とする2つのビットを送信する。
遷移ウィンドウ(長い−短い)を用いたMDCT変換処理は、図1bおよび図1cに表わされている。これらの図は、図1aと同様に実行される計算を表わす。
図1bおよび図1cにおいて、FAと示す(表わされた例においてM=M/2である)いくつかの短い解析ウィンドウのみが表わされている。しかし、実際、図2eに表わされているように、いくつかの(典型的に、M=M/8である)短いウィンドウの連続が与えられる。従って、図1bおよび図1cにおける各ウィンドウFAは、実際、短いウィンドウの連続を含むことが理解される。
符号化されたフレームT’を計算する(Calc T’と示す。)ために、遷移ウィンドウFTA(図1b)は、
− 上昇エッジにおいてM個のサンプルにわたる長い半分のウィンドウと、
− 下降エッジにおいて、
・(M/2−M/2個の)サンプルにわたる(1に等しい重み付け値を有する)第1の平坦な領域PLAと、
・M個のサンプルにわたる下降する短い半分のウィンドウと、
・(M/2−M/2個の)サンプルにわたる(0に等しい重み付け値を有する)第2の平坦な領域PLAと、
を含む。
続く符号化されたフレームT’i+1(Calc T’i+1と示す。)を計算するために、最初の(M/2−M/2個の)サンプルは無視され、従って、短いウィンドウによって処理されず、続くM個のサンプルは、図1bおよび図1cに表わされている短い解析ウィンドウFAの上昇エッジによって重み付けされ、続くM個のサンプルは、その下降エッジによって重み付けされる。
以下で、次の記号が使用される。
・Mは長いフレームのサイズである。
・Mは短いフレームのサイズである。
図1bにおいて、サンプルbは、長いウィンドウのための計算と同様に、短いウィンドウのみ使用して合成される。そして、長い−短い遷移の半分のウィンドウの特定の形態により、解析および合成の遷移ウィンドウから直接にサンプルaが復元される。遷移ウィンドウは図1bおよび図1cにおいてFTAと示されている。
図1cにおいて、長い−短いウィンドウと短いウィンドウの間の遷移領域に対応するサンプルが計算される。図1aにおける長いウィンドウのための計算と同様に、ここでは、eおよびfと示された(円で囲まれた)サンプルの処理が続く。
ウィンドウ遷移の2つの例の場合を以下で説明する。
第1の例において、時間t=720(図2e)でオーディオ信号において短いウィンドウの使用を必要とするアタックが検出される。符号化器は、復号化器に、前に使用された長いウィンドウと続く短いウィンドウの間に介在させる長い−短い遷移ウィンドウの使用を通知しなければならない。
従って、符号化器は、復号化器に、
・長いウィンドウ
・長い−短い遷移ウィンドウ
・短いウィンドウ
・長い−短い遷移ウィンドウ
・長いウィンドウ
の系列を連続的に指示する。そして、復号化器は、
Figure 2010515106
の形の関係式を適用し、ここで、
Figure 2010515106
および
Figure 2010515106
は、互いに異なりうる、時間tおよびt+1における変換の合成関数を表わす。
基底関数
Figure 2010515106
および
Figure 2010515106
が異なる“サイズ”を有するならば、図1bを参照して、次が実行されることを除いて、復元は前述のように実行される。
・2M個のサンプルを生成するサイズMのサンプル
Figure 2010515106
の逆DCT変換。
・2M個のサンプルを生成するサイズMのサンプル
Figure 2010515106
の逆DCT変換。最初のM個のサンプルは、短いウィンドウの上昇部分を含む重複領域において、長さMの共通する時間をサポートし、遷移ウィンドウFTAのサイズMの下降部分の逆DCT変換から生じるサンプルを有する。
・最初の半分について、遷移ウィンドウFTAおよび図1bに示すFTSの2つの合成ウィンドウによる乗算、および、次の半分について、短い合成ウィンドウFSによる乗算。
・重複領域にわたるこれらのウィンドウ化された構成要素の加算。時間サポートは初期のフレームTの最後の部分に対応する。
従って、復号化器は、符号化器に従い、かつ、符号化器によって決定されるウィンドウの種類を信頼して適用する。
この第1の例において、符号化器は、第1のフレーム(例えば、時間t=512とt=767の間にサンプルを有する、図2eにおけるフレーム1)のサンプルの到達の間に遷移を検出する。そして、符号化器は、現在のウィンドウが長い−短い遷移ウィンドウでなければならず、符号化され、送信され、復号化器にシグナリングされなければならないと決定することができる。そして、8個の短いウィンドウが、サンプルt=624とt=911の間に連続的に適用される。従って、遷移の時(t=720)において、復号化器は短いウィンドウを使用し、これは信号の向上した時間表現を可能とする。
第2の例において、サンプルt=540において遷移が検出される。符号化器が最初のフレーム(例えば、図2eにおけるフレーム0)のサンプルを受信すると、遷移を検出せず、従って、長いウィンドウを選択する。次の続くフレーム(例えば、図2eにおけるフレーム1)のサンプルの到達の間に、符号化器は(時間t=540において)アタックを検出する。そして、この場合において、検出は遅過ぎて実行され、遷移ウィンドウの使用は、アタックの瞬間における短い時間サポート(短いウィンドウ)の使用から利益を得ることができない。そして、符号化器は短いウィンドウの使用を予想すべきであり、結果として、少なくともM/2個のサンプルに対応する追加の符号化遅延を挿入する。
従って、知られた先行技術の欠点は、続くフレームの時間信号におけるアタックを検出し、従って、短いウィンドウに移行することを予想することを可能とするために、符号化器に追加の遅延を導入する必要があるという事実に存在することを理解すべきである。この“アタック”は、例えば、音声信号における破裂音のような高い強度の過渡信号、または、音楽シーケンスにおける打撃的な信号の出現に対応しうる。
ある通信の応用において、過渡信号の検出のために必要とされる追加の遅延、および、遷移ウィンドウの使用は受け入れられない。従って、例えば、MPEG−4 AAC低遅延符号化器において、短いウィンドウは使用されず、長いウィンドウのみが許される。
本発明は、上記の場合における向上を提供する。
これは、追加の遅延の導入を必要としないウィンドウ間の遷移に関する。
この目的のために、フレームの連続によって表現されるデジタルオーディオ信号の変換符号化/復号化の方法を提供し、ここで、
・異なるそれぞれの長さを有する少なくとも2つの重み付けウィンドウが与えられ、
・特定の事象が検出されたフレームを符号化するために短いウィンドウが使用される。
この特定の事象は、例えば、現在のフレームが含むデジタルオーディオ信号に存在する強いアタックのような非定常現象でありうる。
より詳しくは、現在のフレームの符号化のために、この現在のフレームにおける特定の事象を検出することが求められ、
・少なくとも、現在のフレームの始めにおいて特定の事象が検出されると、現在のフレームを符号化するために短いウィンドウが使用され、
・一方、現在のフレームにおいて特定の事象が検出されないならば、現在のフレームを符号化するために長いフレームが適用される。
これらのステップは、続くフレームについて繰り返され、それによって、本発明により、長いウィンドウを使用して与えられたフレームを符号化し、かつ、先行技術におけるような遷移ウィンドウを使用することなく、直後に短いウィンドウを使用してこの与えられたフレームにすぐに続くフレームを符号化することを可能とする。
長いウィンドウから短いウィンドウへの直接の移行を可能とすることによって、特定の事象の検出が符号化されるフレームに直接に実行され、先行技術におけるような続くフレームにはもはや実行されない。従って、本発明による方法によって実行される符号化は、先行技術の符号化と異なり、固定サイズのMDCT変換と比較して追加の遅延なしで実行される。
本発明の他の特徴および効果は、以下の詳細な説明、および、先行技術に関して上述した図1、1a、1b、1c、2a、2b、2c、2d、2e以外の添付図面を検討して明らかになる。
変換符号化器の構造を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 サンプルの符号化/復号化処理を表わす図である。 前述した図1bにおけるサンプルaおよびbの詳述が続く、本発明による符号化/復号化処理を表わす図である。 前述した図1cにおけるサンプルeおよびfの詳述が続く、本発明による符号化/復号化処理を表わす図である。 本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。 本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。 本発明による符号化器に適用することができる処理の例を表わす。 本発明による復号化器に適用することができる処理の例を表わす。 符号化器および復号化器のそれぞれの構造、および、符号化において使用されるウィンドウの種類の情報の通信を表わす。 M=512個の成分および重複係数K=4を有するELT変換の場合のための長い合成ウィンドウを表わす。 重複を有する符号化の場合に過去のサンプルの影響を考慮する実施形態において(0とM/2−M/2の間に含まれるnについての)重み付け関数w1,nおよびw2,nの態様を表わす。 この実施形態において(M/2−M/2とM/2+M/2の間に含まれるnについての)重み付け関数w’1,nおよびw’2,nの態様を表わす。 この実施形態において(M/2−M/2とM/2+M/2の間に含まれるnについての)重み付け関数w’3,nおよびw’4,nの態様を表わす。 図8に表わされている実施形態の変形において0とM/2+M/2の間に含まれる全ての範囲のnにわたる重み付け関数w1,nおよびw2,nの態様を表わす。 この変形において0とM/2+M/2の間に含まれる全ての範囲のnにわたる重み付け関数w3,nおよびw4,nの態様を表わす。
本発明は、少なくとも長いウィンドウから短いウィンドウへの移行のために遷移ウィンドウの適用を防止することを可能とする。
こうして、図2eを参照して前述した第2の例では、時間t=540において非定常現象または“アタック”が検出されると、本発明は、フレーム0(時間t=256から時間t=511まで広がるウィンドウ)のために長いウィンドウを使用することを提案する。そして、続くフレーム(t=512からt=767)のサンプルの取得およびt=540におけるアタックの検出の間に、符号化器は、時間t=368(t=512−M/2−M/2に対応する。)から、時間t=655(t=512+M/2+M/2−1に対応し、ここで、説明している例において、
・ 2*M=512は長いウィンドウのサイズ、
・ 2*M=64は短いウィンドウのサイズ
である。)までのサンプルを符号化するために、先行技術に関して図1bおよび図1cに表わされた標準的な非対称遷移ウィンドウなしで、8個の短いウィンドウを使用する。
そして、復号化器に関して、短いウィンドウを用いた符号化されたフレームの受信の間に、復号化器は次の処理を進める。
・現在のフレームのために短いウィンドウを使用しなければならないことを示す符号化器からの情報を受信する。
・符号化の間の長いウィンドウから短いウィンドウへの直接の遷移を補償するために効果的な処理を適用し、この処理の例は、図5bを参照して後に詳細に説明する。
図3aおよび図3bは、一方で、長いウィンドウと短いウィンドウの間で重複しない領域内で見出されるサンプルaおよびb(図3a)、および、他方で、重複領域内で見出されるサンプルeおよびf(図3b)を得るための本発明による符号化/復号化方法を表わす。特に、この重複領域は、長いウィンドウFLの下降エッジ、および、最初の短いウィンドウFCの上昇エッジ、によって定義される。
従って、図3aおよび図3bを参照して、符号化の間に、符号化されたフレームT’を構成するために、フレームTi−1およびTのサンプルが長い解析ウィンドウFLによって重み付けされ、続くフレームTおよびTi+1のサンプルが、遷移ウィンドウを適用することなく、短い解析ウィンドウFCによって直接に重み付けされる。
また、図3aおよび図3bを参照すると、最初の短い解析ウィンドウFCは、(図3bの例におけるサンプルeに先行するサンプルのための)短いウィンドウによって考慮されない値が先行することに留意すべきである。より詳しくは、この処理は、先行技術の符号化器/復号化器と同様に、符号化されるフレームT’i+1の最初のM/2−M/2個のサンプルに適用される。一般に、先行技術と比較して、符号化の間に、および、同様に復号化の間に、実行される処理を可能な限り乱さないことが求められる。従って、例えば、符号化されるフレームT’i+1の最初のサンプルを無視する選択が行われる。
もちろん、図3aおよび図3bにおいて、2つの短い(M=M/2)解析ウィンドウFCの場合のみ表わした。それにもかかわらず、先行技術におけるように、いくつかの短いウィンドウの連続が与えられ、各々のウィンドウの連続は、符号FCが与えられた図3aおよび図3bに表わされている。
直前のフレームT’は長いウィンドウFLを用いて符号化される一方で、短いウィンドウFCを用いて符号化されるフレームT’i+1の復号化について、2つの実施形態を以下で説明する。
第1の実施形態において、復号化の間に合成ウィンドウの使用は全くなしで済まされ、完全な復元の特性が保証されることを表わす。
図3aにおいて、(長いウィンドウから直接に短いウィンドウへの)ウィンドウの変更を必要とするアタックの検出の間に、まず、短いウィンドウのみからのサンプルが合成される(図3aにおけるサンプルb)。そして、長い解析ウィンドウから計算された値v1において、前もって計算されたサンプルbの影響は補償される。サンプルaについて符号化の計算(符号化されたフレームT’)が次のように実行される。
v1=a*h(M+n)+b*h(2*M−1−n)
一方、異なる時間サポート(符号化されたフレームT’i+1)について、結合が続く短いウィンドウからの重み付け計算が実行されるとき、符号化値v2においてサンプルaは重み付けされず、短いウィンドウからの復元の後、
v2=b
を得る。
好ましくは、本発明による符号化/復号化において完全な復元が検証される。実際、
a’=(v1−v2*h(2*M−1−n))/h(M+n)=a
また、復号化の間に、(サンプルaのような)フレームの始めにおけるサンプルの決定の前に、値v2=bから導かれるサンプルおよび続くサンプルがまず決定されなければならないことに留意すべきである。従って、復号化の間に、時間の反転が実行される。
図3bにおいて、長いウィンドウFL(下降エッジ)と最初の短いウィンドウFC(上昇エッジ)の間の遷移領域の符号化されたサンプルが、従って、サンプルeおよびfにおいて計算される。2つのウィンドウFLおよびFCの間のこの重複領域において、符号化された係数(または、以下、“値v1およびv2”)の表現が次式によって与えられる。
v1=e*h(M+n)+f*h(2*M−1−n)
v2=f*h(M−1−m)−e*h(m)
従って、サンプルeおよびfの値を見つけるために、復号化器において、2つの未知数を有するこの方程式を解かなければならない。
e=[v1*h(M−1−m)−v2*h(2*M−1−n)]/[h(M+n)*h(M−1−m)+h(m)*h(2*M−1−n)]
f=[v1*h(m)+v2*h(M+n)]/[h(M−1−m)*h(M+n)+h(2*h−1−n)*h(m)]
また、完全な復元の特性を効果的に検証する数式が導き出され、m=n−M/2+M/2を用いて、
e’=[v1*h(M+m)−v2*h(n)]/[h(M+n)*h(M+m)+h(2*M−1−n)*h(m)]=e
f’=[v1*h(2*M−1−m)+v2*h(M−1−n)]/[h(M+n)*h(M+m)+h(2*M−1−n)*h(m)]=f
(図1cの下に表わされているようにv2が短いウィンドウhによって重み付けされた)先行技術の規定とは対照的に、値v2が長いウィンドウhによって重み付けされることに留意すべきである。
第2の実施形態において、復号化の間に合成ウィンドウが保持される。それらは、図3aおよび図3bに表わされ、長い合成ウィンドウについて符号FLS、短い合成ウィンドウについて符号FCSが付されているように、解析ウィンドウと同じ形態を有する(解析ウィンドウの同類または双対)。この第2の実施形態は、現状の技術の復号化処理、すなわち、長い解析ウィンドウを用いて符号化されたフレームを復号化するために長い合成ウィンドウを用いること、および、一連の短い解析ウィンドウを用いて符号化されたフレームを復号化するために一連の短い合成ウィンドウを用いることに従う利点を有する。
一方、長い−短い遷移ウィンドウを用いて符号化されるべきとき、長いウィンドウを用いて符号化されたフレームを復号化するために“補償”によるこれらの合成ウィンドウの訂正が適用される。言い換えると、長いウィンドウから短いウィンドウへの直接の移行の影響を補償するために、直前のフレームT’が長いウィンドウFLを用いることによって符号化される一方で、短いウィンドウFCを用いることによって符号化された現在のフレームT’i+1を復号化するために、符号化器において以下で説明する処理が用いられる。
サンプルa、b、e、fを値v1およびv2に復号化および結合するための上述した数式は、以下のように、特に、時間の反転を実行する、重み付けされた2項の和の形に書き換えることができる。
まず、最初の短い合成ウィンドウFCS内で、上述した重複領域の後の(典型的に、図3aの説明におけるサンプルv2=bおよび続くサンプルにおける)位置が採用される。短い合成ウィンドウFCSのみから、重複しないこの部分の復号化のために、符号化されたフレームT’i+1の“値”が、まず、v2=b(図3a)から復号化される。サンプルbおよび続くサンプルが復号化されると、続く2項の重み付けされた和が適用され、0≦n<M/2−M/2について、
Figure 2010515106
であり、ここで、
Figure 2010515106
は、(符号化/復号化は完全な復元であるので、初期のサンプルxに対応する)復号化されたサンプルを表わす。
記号
Figure 2010515106
は、訂正なしで長い合成ウィンドウFLSを使用して復号化(DCT−1逆変換の適用)されたサンプルに該当するものを示す。
は、短い合成ウィンドウFCSの連続を用いて十分に復号化されたサンプル(典型的に、サンプルbおよび続くサンプル)を表わす。
2つの重み付け関数w1,nおよびw2,nは、0≦n<M/2−M/2について、
Figure 2010515106
および
Figure 2010515106
と表わされる。
“サンプル”
Figure 2010515106
は、長い合成ウィンドウを使用することによる合成および重み付けによって不完全に復号化された実際の値であることを理解すべきである。典型的に、これは、ウィンドウFLSの係数h(M+n)によって乗算される、図3aにおける値v1に関し、サンプルaのようなフレームTの始めからのサンプルも含まれる。
また、サンプルbおよび続くサンプルがここでまず決定され、上記の数式において“sM−1−n”と表わされ、従って、この第2の実施形態における復号化処理によって提案される時間の反転を表わすことに留意すべきである。
また、(h(M+n)による除算のために)項w1,nが存在しないので、長い合成ウィンドウFLSによって実行される重み付けが防止されることに留意すべきである。
さらに、図3bにおけるサンプルeおよびfの領域に対応する、長いウィンドウFL(下降エッジ)および最初の短いウィンドウFC(上昇エッジ)の両方によって覆われる部分のサンプルの復元のために、好ましくは、2つの重み付けされた項の次の結合が適用される。
Figure 2010515106
ここで、m=n−M/2+M/2、M/2−M/2≦n<M/2+M/2である。
上述したように、項
Figure 2010515106
は、長い合成ウィンドウFLSによる合成および重み付けによって不完全に復元された値を構成し、項
Figure 2010515106
は、最初の短い合成ウィンドウFCSの上昇エッジから不完全に復元された値を表わす。
ここで、重み付け関数w’1,nおよびw’2,nは、次式で与えられる。
Figure 2010515106
および
Figure 2010515106
これら全ての重み付け関数w1,n、w2,n、w’1,n、w’2,nは、長いおよび短いウィンドウのみに依存する固定した要素によって構成される。そのような重み付け関数の変形例は、図4aおよび図4bに表わされている。効果的な実施形態において、これらの関数がとる値は、事前に計算し(一覧表にし)、最終的に本発明による復号化器のメモリに記憶させることができる。
こうして、図5bを参照すると、一実施形態において、長い解析ウィンドウから短い解析ウィンドウに直接に移行するときに、符号化されたフレームT’の復号化の間の処理は次のステップを含みうる。フレームT’(ステップ60)を復号化するために、まず、フレームの終わりの値v2=bを復号化する(ステップ63)ために、短い合成ウィンドウが適用される(ステップ61)。ここで、bを決定するために、続く符号化されたフレームT’i+1に依存する(ステップ62)。そして、関係式
Figure 2010515106
を用いて(ステップ67)、および、事前に計算され一覧表にされた重み付け値w1,nおよびw2,nを用いて(ステップ66)、0とM/2−M/2の間の含まれる任意のnについて補償を適用することによって、フレームT’の始めにおけるサンプルを復号化する(ステップ65)ために、長い合成ウィンドウ(ステップ64)が適用される。
(eとfの間の)符号化されたフレームT’の“中央”の領域の復号化、従って、M/2−M/2とM/2+M/2の間に含まれるnについての復号化は、短いおよび長い合成ウィンドウの両方を使用して(ステップ68)、および、特に、事前に計算され一覧表にされた重み付け値w’1,nおよびw’2,nを用いて(ステップ70)、m=n−M/2+M/2である関係式
Figure 2010515106
による補償を適用することによって(ステップ69)、同様に実行することができる(図5bにおける“+”の符号)。最後に、この処理から、初期のフレームTの全ての種類のサンプルa、b、e、fについての値が導き出される(ステップ71)。
上述した第1および第2の実施形態は、長い解析ウィンドウから短い解析ウィンドウに直接に移行することによって符号化されたフレームT’の復号化の間に、完全な復元を保証し、そして、符号化の間に、長いウィンドウから短いウィンドウに直接に移行することを効果的に可能とする。
ここで、図5aを参照して、少なくとも、ある場合において、長い−短い遷移ウィンドウの符号化の間の適用なしで済ませることを提案する実施形態を説明する。
フレームTを受信すると(ステップ50)、このフレームTにおいて直接に存在するデジタルオーディオ信号の中にアタックATTのような非定常現象の存在が探し出される。この種類の現象が検出されない限り(判定51の出力における矢印n)、このフレームTの符号化のために、長いウィンドウの適用(ステップ52)が継続する。そうでないならば(判定51の出力における矢印y)、現在のフレームTの始め(例えば、最初の半分)において事象ATTが存在するかどうか判定することが求められ(判定53)、この場合(判定53の出力における矢印y)、フレームTの符号化(ステップ56)のために、短いウィンドウ、より正確には、一連の短いウィンドウが直接に適用される(ステップ54)。そして、この実施形態は、遷移ウィンドウを防止し、短いウィンドウを適用するために続くフレームTi+1を待たないことを可能とする。
従って、現状の技術とは反対に、続くフレームTi+1ではなく、符号化されるフレームT内に直接に、非定常現象のような特定の事象を検出することが可能であることを理解すべきである。そして、本発明による符号化遅延は、先行技術のものと比較して低減される。実際、現在のフレームの始めにおいて非定常現象が検出されるならば、短いウィンドウが直接に適用されるが、先行技術においては、Tを符号化する間のフレームに遷移ウィンドウを適用することができるように、続くフレームTi+1において非定常現象を検出することが必要であった。
再び図5aを参照すると、現在のフレームTの終わり(例えば、後半)において非定常現象が検出されるならば(判定53の出力における矢印n)、短いウィンドウの連続を適用する前に、現在のフレームTを符号化する(ステップ56)ために、遷移ウィンドウを適用する(ステップ55)ことを効果的に選択することが可能である。この実施形態は、特に、低減した符号化遅延を保証する一方で、現状の技術の処理に等価な処理を提案することを可能とする。
従って、全体として、この実施形態において少なくとも3つの重み付けウィンドウ
・短いウィンドウ、
・長いウィンドウ、
・長いウィンドウの使用から短いウィンドウの使用に移行するための遷移ウィンドウ、
が与えられ、現在のフレームの終わりにおいて非定常現象のような特定の事象が検出されるならば(ステップ53)、現在のフレーム(T)を符号化する(ステップ56)ために遷移ウィンドウ(ステップ55)が適用される。
この実施形態の変形において、長いウィンドウの使用から短いウィンドウの使用に移行するために、次を与えることができる。
・現在のフレームTについて、長いウィンドウFLの使用。
・直後のフレームTi+1について、現在のフレームの終わりにおいて特定の事象が検出されても、遷移ウィンドウを使用しない、短いウィンドウFCの直接の使用。
この変形は次の利点を有する。符号化器は、ウィンドウの種類の変更についての情報を復号化器に送信しなければならないとき、この情報は、もはや短いウィンドウと遷移ウィンドウの間の選択を復号化器に通知する必要がないので、単一のビットに符号化することができる。
それにもかかわらず、短いウィンドウから長いウィンドウに移行するために、特に、長いウィンドウから短いウィンドウに移行する情報の受信に従い、単一のビットへのウィンドウの種類の変更についての情報の送信を保証し続けるために、遷移ウィンドウを保持することができ、復号化器は、この目的のために、
・短いウィンドウを使用し、
・そして、ウィンドウの種類の変更の情報を受信しないとき、短いウィンドウから長いウィンドウへの遷移ウィンドウを使用し、
・そして、最後に、長いウィンドウを使用することができる。
符号化器10から復号化器20への、符号化の間に使用されるウィンドウの種類の情報の通信が図6に表わされている。符号化器10は、符号化の間にフレームTに含まれる信号において強いアタックのような特定の事象の検出モジュール11を備え、この検出から使用するウィンドウの種類を導き出すことに留意すべきである。この目的のために、モジュール12は、使用するウィンドウの種類を選択し、モジュール12によって選択された解析ウィンドウFAを用いて符号化されたフレームT’を送出する符号化モジュール13にこの情報を送信する。符号化されたフレームT’は、符号化の間に使用されるウィンドウの種類についての情報INFとともに、(通常、単一のデータフローで)復号化器20に送信される。復号化器20は、符号化器10から受信した情報INFに従って合成ウィンドウFSを選択するモジュール22を備え、モジュール23は、復号化されたフレーム
Figure 2010515106
を送出するために、フレームT’の復号化を適用する。
また、本発明は、本発明による方法を実現するための、より詳しくは、図5aに表わされている処理、または、前述したその変形(単一のビットにおけるウィンドウの種類の変更の情報の送信)を実現するための、図6における符号化器10のような符号化器に関する。
また、本発明は、そのような符号化器のメモリ内に記憶され、符号化器のプロセッサによって実行されるとき、そのような処理またはその変形を実現するための命令を含むコンピュータプログラムに関する。この目的のために、図5aは、そのようなプログラムのフローチャートを表現しうる。
上記の第2の実施形態に従って、符号化器10は解析ウィンドウFAを使用し、復号化器20は合成ウィンドウを使用し、これらの合成ウィンドウは、それにもかかわらず、(重み付け関数w1,n、w2,n、w’1,n、w’2,nを使用して)前述した補償による訂正を進めることによって、解析ウィンドウFAに対応するものであることに留意すべきである。
また、本発明は、図6に表わされている復号化器20のような変換復号化器のメモリ内に記憶され、この復号化器20のプロセッサによって実行されるとき、第1の実施形態、または、図5bを参照して上述した第2の実施形態に従う復号化の実現のための命令を含むもう1つのコンピュータプログラムに関する。この目的のために、図5bは、そのようなプログラムのフローチャートを表現しうる。
また、本発明は、変換復号化器それ自身に関し、復号化のためのコンピュータプログラムの命令を記憶するメモリを備える。
包括的な用語では、それぞれ異なる長さの、少なくとも2つの種類の重み付け関数を使用して符号化されたフレームの連続によって表現される信号の本発明による変換復号化方法は、次のように実行される。
長いウィンドウから短いウィンドウに移行するための情報を受信した場合、短い解析ウィンドウFCを使用して符号化された、与えられたフレームT’i+1に、1つの種類の短い合成ウィンドウFCSを使用した復号化から(種類bの)サンプルが決定される。
1つの種類の長い解析ウィンドウFLを使用して符号化された、与えられたフレームに先行するフレームT’を部分的に復号化し(逆変換DCT−1の適用)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数を用いて2つの重み付けされた項を結合することによって他のサンプルが得られる。
上記の第2の実施形態において、w1,n、w2,n、w’1,n、w’2,nと示された関数が含まれる。
しかし、この包括的な復号化処理は、第1および第2の実施形態の2つの場合に適用される。
第2の実施形態において、
・まず、与えられたフレーム(T’i+1)からサンプル(b)が決定され(図5bのステップ63)、
・時間的に前のフレーム(T’)の始めに対応するサンプル(a)が導き出され(ステップ65〜67)、これらは長い合成ウィンドウFLSを使用した復号化から生じ、第2の実施形態に属す。
この場合において、
・M個のサンプルを含むフレーム、
・2M個のサンプルを含む長いウィンドウ、
・MはMより小さい、2M個のサンプルを含む短いウィンドウについて、
n=0は復号化されるフレームの始めに対応し、0と(M/2−M/2)の間に含まれるnについて、サンプル
Figure 2010515106
は、
Figure 2010515106
の形の2つの重み付けされた項の結合によって与えられ、ここで、
Figure 2010515106
は、前のフレームT’から生じる値(v1)であり、
M−1−nは、与えられたフレームT’i+1に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
1,nおよびw2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
あるいは、(M/2−M/2)と(M/2+M/2)の間に含まれるnについて、サンプル
Figure 2010515106
は、
Figure 2010515106
の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+M/2であり、
Figure 2010515106
は、前のフレームT’から生じる値v1であり、
Figure 2010515106
は、与えられたフレームT’i+1から生じる値v2であり、
w’1,nおよびw’2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
従って、本発明は、変換の完全な復元の特性を保持する一方で、先行技術と比較して低減した遅延を有するウィンドウ間の遷移を提供することを可能とする。この方法は、全ての種類のウィンドウ(非対称なウィンドウ、および、異なる解析および合成ウィンドウ)を用いて、異なる変換およびフィルタバンクのために適用することができる。
長いウィンドウからより小さいサイズのウィンドウへの遷移の場合において上述した補償処理は、短いウィンドウからより大きいサイズのウィンドウへの遷移の場合に、自然に、かつ、同様に、拡張される。この場合において、短い−長い遷移ウィンドウの不存在は、上述した場合と同様の重み付けによって復号化器において補償することができる。
そして、本発明は任意の変換符号化、特に、MPEG−4“AAC−低遅延”標準におけるような対話的な従来の応用のために提供される変換符号化だけでなく、MDCT変換と異なる変換、特に、上述したELT(Extended Lapped Transform)およびそれらの双直交の拡張に適用することができる。
しかし、特に、ELT型の変換の場合に、変調(v1)による時間畳み込みの項は、過去に生じた時間畳み込みの項と結合されうることが認められる。従って、上述した訂正処理は、将来のサンプルに影響する現象(または“折り返し歪み(aliasing)”)を考慮する。一方、また、以下で示す詳述は、少なくとも量子化の不存在において、完全な復元を得るように、過去の成分を除去するために、過去の成分を考慮する。従って、合成された過去の信号と結合して、時間畳み込みの項なしで済ませることを可能とする追加の重み付け関数をここで定義することを提案する。
以下でELT変換の一例として文献:Gerald D. T. Schuller、Tanja Karp、“Modulated Filter Banks with Arbitrary System Delay: Efficient Implementations and the Time-Varying Case”、IEEE Transactions on Signal Processing、2000年3月、第48巻、第3号の記載を参照する。
本発明の枠組みの中での続く実施形態は、(例えば、2048個のサンプルを有する)長いウィンドウと(例えば、128個のサンプルを有する)短いウィンドウの間の遷移なしで移行することを提案する。
<長いウィンドウ(K=4、M=512)を用いた変換>
これは低遅延の変換であり、そのウィンドウはK・M=2048のサイズを有し、その解析は、0≦k≦M−1について、
Figure 2010515106
の形で表わされる。
Mは得られたスペクトル成分の数であり、
Figure 2010515106
は、−2M≦n≦2M−1について、ウィンドウ化された入力信号の表記であり、
Figure 2010515106
は長い合成ウィンドウの表記である。
図7は、M=512個の成分および重複係数K=4を有するELT変換の場合についての長い合成ウィンドウを表わす。
逆変換は、0≦n≦4M−1について、
Figure 2010515106
と表わされ、復元される信号xn+tMは、4つの要素(K=4)の復元する加算
n+tM=zt,n+zt−1,n+M+zt−2,n+2M+zt−3,n+3M
によって得られ、ここで、0≦n≦M−1、および、
Figure 2010515106
である。
合成ウィンドウは、0≦n≦4M−1について、
Figure 2010515106
として定義され、一方、解析ウィンドウは、サンプルの順序の反転、すなわち、0≦n≦4M−1について、
Figure 2010515106
によって合成ウィンドウから定義されることに留意すべきである。
<短いウィンドウ(K=2、M=64)を用いた変換>
短いウィンドウの場合に、解析変換は、0≦k≦M−1について、
Figure 2010515106
の形に表わされ、ここで、ウィンドウ化された入力信号として、0≦n≦2M−1について、
Figure 2010515106
であり、短い合成ウィンドウとしてw(n)である。
逆変換は、0≦n≦2M−1について、
Figure 2010515106
であり、復元される信号xn+tMは、2つの要素(K=2)の復元する加算によって得られ、0≦n≦M−1について、
Figure 2010515106
および
Figure 2010515106
である。
この表記において、tは短いフレームのインデックスであり、解析および合成ウィンドウは同一であり、それらは対称であるので、0≦n<2Mについて、
Figure 2010515106
である。
<重み付け関数の数式>
この実施形態において、
・M個のサンプルを含むフレーム、
・4M個のサンプルを含む長いウィンドウ、
・MはMより小さい、2M個のサンプルを含む短いウィンドウについて、
0と(M/2−M/2)の間に含まれるn(n=0は復号化の処理においてフレームの始めに対応する)について、サンプル
Figure 2010515106
は、0≦n≦M/2−M/2について、
Figure 2010515106
の形の4つの重み付けされた項の結合によって与えられ、ここで、
Figure 2010515106
は、(符号化/復号化が完全な復元であるならば、初期のサンプルxに対応する)復号化されたサンプルを表わす。
表記
Figure 2010515106
は、フレームT’を訂正することなく、先行する計算要素zt−1,n+2M+zt−2,n+3Mに加算して、長い合成ウィンドウを使用して、与えられたフレーム(T’i+1)に先行するフレーム(T’)の不完全に復号化されたサンプル(逆変換の適用)に対応することを示す。
は、(M/2+M/2≦n<Mであるようなインデックスnのサンプルについて)フレームT’i+1の短い合成ウィンドウFCSの連続を使用して完全に復号化されたサンプル、および、前のフレームの完全に復号化されたサンプル(0≦n<Mについてsn−2Mと表わされ、{s−2M,s−2M+1,...,s−M−1}に等しい。)を表わす。
1,n、w2,n、w3,n、w4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
好ましくは、特に、完全な復元を保証するために、重み付け関数として次式を選択することができる。0≦n<M/2−M/2について、
Figure 2010515106
1,nおよびw2,nの形式は、MDCT変換の場合に前述したものと少し異なることに留意すべきである。実際、フィルタはもはや対称でなく(hの項が消えている)、変調の項が変更され、これは符号の変更を説明する。
そして、この実施形態において、M/2−M/2とM/2+M/2の間に含まれるnについて、サンプル
Figure 2010515106
は、
Figure 2010515106
の形の4つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+M/2、かつ、M/2−M/2≦n<M/2+M/2である。
同じ表記に従い、
Figure 2010515106
は、与えられたフレームT’i+1に先行するフレームT’の不完全に復号化されたサンプルである。
Figure 2010515106
は、与えられたフレームT’i+1の最初の短いウィンドウの不完全に復号化されたサンプルである。
は、前のフレーム(T’i−1,T’i−2,...)において完全に復号化されたサンプルを表わす。
w’1,n、w’2,n、w’3,n、w’4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
好ましくは、完全な復元を保証するために、次式
Figure 2010515106
に従って重み付け関数を選択することができ、ここで、M/2−M/2≦n<M/2+M/2、m=n−M/2+M/2である。
従って、この実施形態において、長いウィンドウと短いウィンドウの間での遷移の間に、信号は、
・短いウィンドウから復元されたサンプルの重み付けされたもの、
・長いウィンドウから部分的に復元されたサンプルの重み付けされたもの(計算の項zt−1,n+2M+zt−2,n+3Mの部分)、
・過去の合成された信号のサンプルの結合の重み付けされたもの、
の結合から復元される。
この実施形態の変形において、関数w’3,nおよびw’4,nは大きく異ならないことに留意すべきである。項h(4M−1−n)およびh(3M+n)のみがそれらの数式において異なる。一実施形態は、例えば、項h(4M−1−n)sn−2M+h(3M+n)s−M−1−nを用意し、そして、
Figure 2010515106
によって表現される関数による結果を重み付けすることからなり、従って、これは項h(4M−1−n)およびh(3M+n)の寄与が除かれた関数w’3,nおよびw’4,nに対応する。
これと同じ原理が同様にw3,nおよびw4,nに適用される。
もう1つの変形において、合成の計算が重み付けされる。好ましくは、長いウィンドウから不完全に復元されたサンプルが、重み付けされた計算zt−1,n+2M+zt−2,n+3Mに加算されるように、合成の計算のこの重み付けをゼロに設定することができる。この場合において、過去に合成された信号に適用される重み付けは異なりうる。
前述した実施形態において得られる重み付け関数wおよびw’の特性の形態は、図9および図10に表わされている。特に、これらのグラフのy軸の値を参照すると、図10に表わされている関数w’3,nおよびw’4,nは、図9に表わされている関数w’1,nおよびw’2,nに関して(とる値を考慮して)無視できることが分かる。従って、関数w’3,nおよびw’4,nが含まれる項は、信号
Figure 2010515106
の復元に関して上記で与えられた合計
Figure 2010515106
において省略することができる。この省略は低い復元のエラーに導く。
また、より大きい処理の簡単さを意図する変形において、w’3,nおよびw’4,nはたいへん類似していることが分かる。従って、時間の計算における利得を達成するために、これらの2つの関数の重み付けの結合のみ、例えば、2つの関数の平均を使用するために提供することができる。
(重み付け関数w1,nおよびw2,nの態様を表わす)図8および(重み付け関数w3,nおよびw4,nの態様を表わす)図12における比較は、関数w1,nおよびw2,nに関して関数w3,nおよびw4,nのために同じ言及を引き起こす。
従って、
Figure 2010515106
の前述の数式を簡単にすることを可能とする。
・関数w3,nおよびw4,nによる重み付けが省略されるならば、
Figure 2010515106
・または、例えば、
Figure 2010515106
、または、緩やかな復元のエラーに導くこれら2つの関数の任意の他の線形結合を用いて、
Figure 2010515106
関数w3,nおよびw4,nによる重み付けの省略が信号より下の84dBの電力を有する復元のエラーに導き、単純な線形結合(例えば、これらの関数の平均)の使用それ自体が信号より下の96dBのエラーに導くことを留意すべきであり、これら両方の場合においてオーディオの応用のために既にたいへん十分である。完全な復元は、実際、通常、信号より下の120から130dBのエラー電力を測定することを可能とすることに留意すべきである。
さらに、重み付け[1]において、もはや計算の項sn−2Mおよびs−M−1−nを使用しないことは、過去からの量子化ノイズの拡散を防止することを可能とする。従って、量子化が存在しない不完全な復元が、信号が良好に符号化されるとき量子化ノイズの制限のために差し替えられる。
また、時間サポート0−128(図8および図12)において、重み付け関数は特定の形
Figure 2010515106
を有することに留意すべきである。
説明した例において、0と128の間にゼロの大きさを有する最初の部分を含むウィンドウh(n)(図7)の形式によってこの観察が説明される。従って、この例において、複雑さのために、最初の復元を2つのフェーズ、0≦n<128について、
Figure 2010515106
および、128≦n<M/2−M/2=224について、
Figure 2010515106
に細分化することが好ましい。
効果的なアルゴリズム構造を有する一実施形態において、一方で、重み付け関数w1,nおよびw2,n(図11)、および、他方で、w3,nおよびw4,n(図12)は、ここで開示されたように、0から(M+M)/2の全体の間隔にわたって定義することができる。
最初のステップにおいて、復元される信号
Figure 2010515106
の(
Figure 2010515106
と示す)主要な数式の計算は、0から(M+M)/2まで、次のように行われる。
Figure 2010515106
(これは、この同じ範囲にわたって計算され、図12に表わされている関数w3,nおよびw4,nとともに、図11において0とM/2+M/2の間に含まれるnの全体の範囲にわたって表わされている関数w1,nの計算に導く。)
そして、(n=0は復号化の処理においてフレームの始めに対応する)0とM/2−M/2の間に含まれるnについて、
Figure 2010515106
とし、ここで、w2,nは、図11においてw2,nと示す曲線の始め(x軸における224の前)に対応し、M/2−M/2とM/2+M/2の間に含まれるnについて、
Figure 2010515106
とし、m=n−M/2+M/2、および、M/2−M/2≦n<M/2+M/2であり、ここで、w’2,nは、図11においてw2,nと示す曲線の終わり(x軸における224の後)に対応する。
関数w2,nおよびw’2,nによって重み付けするための特定の処理の特徴を以下で説明する。
各々の関数w1,n、w3,n、w4,nについて、0とM/2+M/2の間の1つのみの変化を用いることが可能である。他方、関数w2,nおよびw’2,nについて、
・関数w2,nは完全に復号化されたサンプルを重み付けし、
・一方、関数w’2,nは不完全に復号化されたサンプルを重み付けする。
さらに、処理の“時間の反転”は、重み付けw2,nについてのみに示し(−nによるsのインデックス)、重み付けw’2,nについては示さない。
従って、(重複K>2である)長いウィンドウから(重複K’<Kである)短いウィンドウへの遷移の間のサンプルの完全な復号化のために過去のサンプルの影響を低減させることを可能とするこの詳述を包括的な用語で要約すると、復号化されたサンプルは、過去の合成信号を含む少なくとも2つの重み付けされた項の結合によって得られる。
10 ・・・符号化器
20 ・・・復号化器

Claims (13)

  1. それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用して符号化されたフレームの連続によって表現される信号の変換復号化のための方法であって、
    長いウィンドウから短いウィンドウに移行するための情報を受信した場合に、
    短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定し(63)、
    前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’)を部分的に復号化し(DCT−1)、かつ、
    一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)ことを特徴とする方法。
  2. 前記与えられたフレーム(T’i+1)から生じるサンプル(b)がまず決定され(63)、
    該サンプルから時間的に前のフレーム(T’)の始めに対応するサンプル(a)が導き出され(65〜67)、該サンプルは長い合成ウィンドウを使用した復号化から生じることを特徴とする請求項1に記載の方法。
  3. フレームはM個のサンプルを含み、
    長いウィンドウは2M個のサンプルを含み、
    短いウィンドウは2M個のサンプルを含み、MはMより小さく、
    サンプル
    Figure 2010515106
    は、n=0が復号化の処理においてフレームの始めに対応し、0と(M/2−M/2)の間に含まれるnについて、
    Figure 2010515106
    の形の2つの重み付けされた項の結合によって与えられ、ここで、
    Figure 2010515106
    は、前のフレーム(T’)から生じる値(v1)であり、
    M−1−nは、前記与えられたフレーム(T’i+1)に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
    1,nおよびw2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項2に記載の方法。
  4. フレームはM個のサンプルを含み、
    長いウィンドウは2M個のサンプルを含み、
    短いウィンドウは2M個のサンプルを含み、MはMより小さく、
    サンプル
    Figure 2010515106
    は、n=0が復号化の処理においてフレームの始めに対応し、(M/2−M/2)と(M/2+M/2)の間に含まれるnについて、
    Figure 2010515106
    の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+M/2であり、
    Figure 2010515106
    は、前のフレーム(T’)から生じる値(v1)であり、
    Figure 2010515106
    は、前記与えられたフレーム(T’i+1)から生じる値(v2)であり、
    w’1,nおよびw’2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項1から3のいずれか1項に記載の方法。
  5. 過去のサンプルの影響を低減させるために、重複変換符号化によって符号化されたフレームを復号化するために、復号化される信号は、
    短いウィンドウから復元されたサンプルの重み付け、
    長いウィンドウから部分的に復元されたサンプルの重み付け、
    過去の復号化された信号のサンプルの重み付け、
    の結合から復元されることを特徴とする請求項1から4のいずれか1項に記載の方法。
  6. M個のサンプルを含むフレーム、
    4M個のサンプルを含む長いウィンドウ、
    がMより小さい、2M個のサンプルを含む短いウィンドウを用いて、
    n=0が復号化の処理においてフレームの始めに対応し、0とM/2−M/2の間に含まれるサンプルのインデックスnについて、復号化されるサンプル
    Figure 2010515106
    は、0≦n<M/2−M/2について、
    Figure 2010515106
    の形の4つの重み付けされた項の結合によって生成され、
    表記
    Figure 2010515106
    は、zt−1,n+2M+zt−2,n+3Mと示す先行する計算要素への訂正なしで加算して、長い合成ウィンドウを使用して、前記与えられたフレーム(T’i+1)に先行するフレーム(T’)の不完全に復号化されたサンプルを示し、インデックスtはフレームのインデックスであり、
    は、M/2+M/2≦n<Mについて、前記与えられたフレーム(T’i+1)の短い合成ウィンドウ(FCS)の連続を使用して完全に復号化されたサンプル、および、−2M≦n<Mについて、前のフレーム(T’,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
    1,n,w2,n,w3,n,w4,nは、それぞれ、サンプルのインデックスnに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w1,nおよびw2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5に記載の方法。
  7. M個のサンプルを含むフレーム、
    4M個のサンプルを含む長いウィンドウ、
    がMより小さい、2M個のサンプルを含む短いウィンドウを用いて、
    M/2−M/2とM/2+M/2の間に含まれるnについて、復号化されるサンプル
    Figure 2010515106
    は、
    Figure 2010515106
    の形の4つの重み付けされた項の結合によって与えられ、
    Figure 2010515106
    は、前記与えられたフレーム(T’i+1)に先行するフレーム(T’)の不完全に復号化されたサンプルであり、
    Figure 2010515106
    は、m=n−M/2+M/2であり、前記与えられたフレーム(T’i+1)の最初の短いウィンドウの不完全に復号化されたサンプルであり、
    は、前のフレーム(T’,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
    w’1,n,w’2,n,w’3,n,w’4,nは、それぞれ、nに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w’1,nおよびw’2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5または6に記載の方法。
  8. nの関数として前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶され、サンプル
    Figure 2010515106
    の計算において前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の寄与は無視されることを特徴とする請求項6または7に記載の方法。
  9. 前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)は、前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の線形結合の結果である単一の重み付け関数(w3−4,n;w’3−4,n)によって与えられ、nの関数として前記単一の重み付け関数(w3−4,n;w’3−4,n)がとる値とともに、前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項6または7に記載の方法。
  10. 0から(M+M)/2までのnについて、
    Figure 2010515106
    の形の重み付けされた結合に従って、復号化される信号
    Figure 2010515106
    の主要な数式
    Figure 2010515106
    が計算され、
    n=0が復号化の処理においてフレームの始めに対応し、0とM/2−M/2の間に含まれるnについて、
    Figure 2010515106
    とし、
    M/2−M/2とM/2+M/2の間に含まれるnについて、
    Figure 2010515106
    とし、m=n−M/2+M/2であることを特徴とする請求項6および7に記載の方法。
  11. それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用する符号化器から生じるフレームの連続によって表現される信号の変換復号化器であって、
    長いウィンドウから短いウィンドウに移行するための情報を受信する手段と、
    短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定する手段と、
    前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’)を部分的に復号化し(DCT−1)、かつ、
    一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)手段と、
    を備えることを特徴とする変換復号化器。
  12. 変換復号化器のメモリ内に記憶されるコンピュータプログラムであって、
    前記変換復号化器のプロセッサによって実行されるとき、請求項1から10のいずれか1項に記載の方法を実現するための命令を含むことを特徴とするコンピュータプログラム。
  13. 請求項12に記載のコンピュータプログラムの命令を記憶するメモリを備えることを特徴とする変換復号化器。
JP2009544424A 2007-01-05 2007-12-18 重み付けウィンドウを用いた低遅延変換符号化 Active JP5247721B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR07/00056 2007-01-05
FR0700056A FR2911227A1 (fr) 2007-01-05 2007-01-05 Codage par transformee, utilisant des fenetres de ponderation et a faible retard
FR0702768A FR2911228A1 (fr) 2007-01-05 2007-04-17 Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR07/02768 2007-04-17
PCT/FR2007/052541 WO2008081144A2 (fr) 2007-01-05 2007-12-18 Codage par transformee, utilisant des fenetres de ponderation et a faible retard

Publications (2)

Publication Number Publication Date
JP2010515106A true JP2010515106A (ja) 2010-05-06
JP5247721B2 JP5247721B2 (ja) 2013-07-24

Family

ID=39540608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009544424A Active JP5247721B2 (ja) 2007-01-05 2007-12-18 重み付けウィンドウを用いた低遅延変換符号化

Country Status (8)

Country Link
US (1) US8615390B2 (ja)
EP (1) EP2104936B1 (ja)
JP (1) JP5247721B2 (ja)
KR (1) KR101437127B1 (ja)
AT (1) ATE498886T1 (ja)
DE (1) DE602007012587D1 (ja)
FR (1) FR2911228A1 (ja)
WO (1) WO2008081144A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012516464A (ja) * 2009-09-18 2012-07-19 ドルビー インターナショナル アーベー 高調波転換
US10770084B2 (en) 2015-09-25 2020-09-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009081003A1 (fr) * 2007-12-21 2009-07-02 France Telecom Codage/decodage par transformee, a fenetres adaptatives
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
EP2619758B1 (en) * 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
ES2535609T3 (es) 2011-02-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio con estimación de ruido de fondo durante fases activas
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
MX348505B (es) 2013-02-20 2017-06-14 Fraunhofer Ges Forschung Aparato y método para generar una señal codificada o para decodificar una señal de audio codificada usando una porción multi superpuesta.
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP3741885A4 (en) 2018-01-18 2021-10-20 Toray Industries, Inc. COLORABLE POLYOLEFIN FIBERS AND FIBER STRUCTURES THEREFORE
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05502983A (ja) * 1989-10-06 1993-05-20 トムソン コンシューマー エレクトロニクス セイルズ ゲゼルシャフト ミット ベシュレンクテル ハフツング 信号伝送方法
JP2000500247A (ja) * 1996-07-11 2000-01-11 フラオホッフェル―ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. 可聴信号のコーディングおよびデコーディング方法
JP2010501153A (ja) * 2006-08-18 2010-01-14 デジタル ライズ テクノロジー シーオー.,エルティーディー. フレーム型データの可変分解能処理

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5173695A (en) * 1990-06-29 1992-12-22 Bell Communications Research, Inc. High-speed flexible variable-length-code decoder
US5347478A (en) * 1991-06-09 1994-09-13 Yamaha Corporation Method of and device for compressing and reproducing waveform data
JP2876497B2 (ja) * 1991-08-23 1999-03-31 松下電器産業株式会社 誤り訂正符復号化方法およびその装置
FR2687871B1 (fr) * 1992-02-25 1995-07-07 France Telecom Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5689800A (en) * 1995-06-23 1997-11-18 Intel Corporation Video feedback for reducing data rate or increasing quality in a video processing system
BE1010336A3 (fr) * 1996-06-10 1998-06-02 Faculte Polytechnique De Mons Procede de synthese de son.
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6339804B1 (en) * 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
AU754877B2 (en) * 1998-12-28 2002-11-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
US7177805B1 (en) * 1999-02-01 2007-02-13 Texas Instruments Incorporated Simplified noise suppression circuit
DE10000934C1 (de) * 2000-01-12 2001-09-27 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
US20010044919A1 (en) * 2000-05-05 2001-11-22 Edmonston Brian S. Method and apparatus for improved perormance sliding window decoding
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
WO2002071389A1 (fr) * 2001-03-06 2002-09-12 Ntt Docomo, Inc. Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7272551B2 (en) * 2003-02-24 2007-09-18 International Business Machines Corporation Computational effectiveness enhancement of frequency domain pitch estimators
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
JP4836720B2 (ja) * 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
EP2346029B1 (en) * 2008-07-11 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and corresponding computer program
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size
KR101616054B1 (ko) * 2009-04-17 2016-04-28 삼성전자주식회사 음성 검출 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05502983A (ja) * 1989-10-06 1993-05-20 トムソン コンシューマー エレクトロニクス セイルズ ゲゼルシャフト ミット ベシュレンクテル ハフツング 信号伝送方法
JP2000500247A (ja) * 1996-07-11 2000-01-11 フラオホッフェル―ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. 可聴信号のコーディングおよびデコーディング方法
JP2010501153A (ja) * 2006-08-18 2010-01-14 デジタル ライズ テクノロジー シーオー.,エルティーディー. フレーム型データの可変分解能処理

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012516464A (ja) * 2009-09-18 2012-07-19 ドルビー インターナショナル アーベー 高調波転換
US10770084B2 (en) 2015-09-25 2020-09-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding

Also Published As

Publication number Publication date
US8615390B2 (en) 2013-12-24
EP2104936A2 (fr) 2009-09-30
FR2911228A1 (fr) 2008-07-11
JP5247721B2 (ja) 2013-07-24
DE602007012587D1 (de) 2011-03-31
ATE498886T1 (de) 2011-03-15
WO2008081144A3 (fr) 2008-09-18
US20100076754A1 (en) 2010-03-25
EP2104936B1 (fr) 2011-02-16
KR101437127B1 (ko) 2014-09-03
KR20090107051A (ko) 2009-10-12
WO2008081144A2 (fr) 2008-07-10

Similar Documents

Publication Publication Date Title
JP5247721B2 (ja) 重み付けウィンドウを用いた低遅延変換符号化
JP6450802B2 (ja) 音声符号化装置および方法
JP5083779B2 (ja) オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法
RU2586841C2 (ru) Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему
US7876966B2 (en) Switching between coding schemes
JP6109162B2 (ja) 遅延が最適化された重み付け窓(Weighting Window)を用いて符号化/復号化する方法
JP5270006B2 (ja) 周波数領域におけるオーディオ信号ラウドネス決定と修正
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
KR20100085018A (ko) 신호 처리 방법 및 장치
KR100912587B1 (ko) 오디오 신호 보간 방법 및 오디오 신호 보간 장치
JP2005533272A (ja) オーディオコーディング
WO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JP5328804B2 (ja) 適応型ウィンドウを有する変換ベースの符号化/復号化
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
JP4699117B2 (ja) 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
EP2551848A2 (en) Method and apparatus for processing an audio signal
KR101601906B1 (ko) 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며오디오 신호를 부호화하는 장치 및 방법
WO2011052191A1 (ja) トーン判定装置およびトーン判定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130409

R150 Certificate of patent or registration of utility model

Ref document number: 5247721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250