JP2012509515A - スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 - Google Patents

スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 Download PDF

Info

Publication number
JP2012509515A
JP2012509515A JP2011543801A JP2011543801A JP2012509515A JP 2012509515 A JP2012509515 A JP 2012509515A JP 2011543801 A JP2011543801 A JP 2011543801A JP 2011543801 A JP2011543801 A JP 2011543801A JP 2012509515 A JP2012509515 A JP 2012509515A
Authority
JP
Japan
Prior art keywords
signal
coding
enhancement
quantization
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011543801A
Other languages
English (en)
Other versions
JP5474088B2 (ja
Inventor
バラーツ・コヴシー
ステファン・ラゴ
アラン・ル・ギヤデール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2012509515A publication Critical patent/JP2012509515A/ja
Application granted granted Critical
Publication of JP5474088B2 publication Critical patent/JP5474088B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、音声デジタル信号のスケーラブル符号化のための方法であって、入力信号の共通のセクションに対して、共通のセクションの各サンプルnに対するスカラ数量化のインデックス(IB(n))を生成するコア符号化ステップと、エンハンスメント信号の各符号化サンプルに対するスカラ数量化(Qk enh)のインデックス(Jk(n))を生成する、少なくとも1つのエンハンスメント符号化ステップとを含む方法に関する。この方法は、エンハンスメント符号化ステップは、目標信号を決定するために使用される符号化ノイズを変換するためのフィルタ(W(z))を得るステップを含み、前記エンハンスメント信号のスカラ数量化(Qk enh(n))に対するインデックス(Jk(n))は、可能なスカラ数量化値の組と、前記目標信号との間の誤差を最小化することにより決定されるというものである。本発明による符号化方法は、さらに、コアフローを符号化するための符号化ノイズの変換を含むことができる。

Description

本発明は、デジタル信号の符号化の分野に関する。
本発明による符号化は、特に、可聴周波数信号(音声、音楽など)のようなデジタル信号の送信および/または格納に適している。
本発明は、より詳細には、ADPCM(「適応差分パルス符号変調」を表す)符号化タイプの波形符号化、および、特に、スケーラブルなバイナリ列(binary train)で量子化インデックスを送出することを可能にする、埋め込み符号(embedded code)を用いるADPCMタイプの符号化に関する。
ITU-T G.722またはITU-T G.727の勧告により具体的に明記される、埋め込み符号ADPCM符号化/復号化の一般的な原理は、図1および図2を参照して説明されるようなものである。
すなわち、図1は、ADPCMタイプの埋め込み符号のコーダを示す。
それは、
− 信号
の予測を、量子化誤差信号(quantized error signal)の前のサンプル
(ただし、ν(n’)はスケールファクタである)に基づいて、および、再構成信号(reconstructed signal)の前のサンプルrB(n’)(n’=n-1〜n-NP、ただし、nは現在の時点である)に基づいて与えることを可能にする予測モジュール110、
− e(n)で示される予測誤差信号を得るために、入力信号x(n)から、その予測
を差し引く減算モジュール120、
− B+Kビットからなる量子化インデックスIB+K(n)を与えるために、入力として誤差信号e(n)を受信する、誤差信号に対する量子化モジュール130QB+Kを備える。量子化モジュールQB+Kは、埋め込み符号タイプの量子化モジュールであり、すなわち、それは、Bビットを用いるコア量子化器(core quantizer)、および、コア量子化器に埋め込まれる、B+k(k=1〜K)ビットを用いる量子化器を備える。
ITU-T G.722標準の場合には、B=4に対する量子化器QB、QB+1、QB+2の判定レベルおよび再構成レベルが、“X. Maitre、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”による、G.722標準を説明する概論の表IVおよびVIによって定義される。
量子化モジュールQB+Kの出力でのB+Kビットの量子化インデックスIB+K(n)は、送信チャネル140を介して、図2を参照して説明されるようなデコーダに送信される。
コーダは、さらに、
− 低ビットレートインデックスIB(n)を与えるために、インデックスIB+K(n)のK個の低次ビットを削除するためのモジュール150、
− 出力として、Bビットの量子化誤差信号
を与えるための逆量子化モジュール120(QB)-1
− 量子化器および逆量子化器に対して、次の時点に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与えるための、適応化モジュール(adaptation module)170QAdapt
− 低ビットレートの再構成信号rB(n)を与えるために、量子化誤差信号に対して、予測
を加算するための加算モジュール180、
− 予測モジュールに対する、Bビットの量子化誤差信号
に基づく、および、1+Pz(z)によりフィルタリングされる信号
に基づく適応化モジュール190PAdapt
を備える。
図1では、155と符号が付けられたドット表示の部分が、予測器(predictor)165および175、ならびに逆量子化器120を含む、低ビットレートのローカルデコーダを示すことが確認され得る。したがって、このローカルデコーダは、逆量子化器120を、170で、低ビットレートインデックスIB(n)に基づいて適応させること、ならびに、予測器165および175を、再構成低ビットレートデータに基づいて適応させることを可能にする。
この部分は、図2を参照して説明されるような埋め込み符号ADPCMデコーダにおいて、同じように見られる。
図2の埋め込み符号ADPCMデコーダは、入力として、送信チャネル140から発生するインデックスI’B+K、バイナリエラーにより場合によっては乱される可能性があるIB+Kの変形(version)を受信し、信号
を得るために、1サンプル当たりBビットのビットレートの逆量子化モジュール210(QB)-1による逆量子化を実行する。記号「’」は、送信エラーのために、コーダにより送信されるものと、場合によっては異なる可能性がある、デコーダで受信される値を示す。
Bビットで表される出力信号r’B(n)は、信号の予測と、Bビットを用いる逆量子化器の出力との和に等しいことになる。デコーダのこの部分255は、図1の低ビットレートのローカルデコーダ155と同一である。
ビットレートインジケータモードおよびセレクタ220を使用することにより、デコーダは、復元される信号の質をエンハンスする(enhance:高める)ことができる。
実際は、モードが、B+1ビットが送信されたことを示すならば、出力は、予測
と、B+1ビットを用いる逆量子化器230の出力
との和に等しいことになる。
モードが、B+2ビットが送信されたことを示すならば、出力は、予測
と、B+2ビットを用いる逆量子化器240の出力
との和に等しいことになる。
z変換の表記を使用することにより、この繰り返しの構造を表すために、以下のように記述され得る。
RB+k(z)=X(Z)+QB+k(z)
ただし、B+kビットでの量子化ノイズQB+k(z)を次式により定義する。
ITU-T G.722標準(以下、G.722という)の埋め込み符号ADPCM符号化は、[50〜7000Hz]の最小の帯域幅で規定され、16kHzでサンプリングされる、広帯域での信号の符号化を実行する。G.722の符号化は、直交ミラーフィルタによる信号の分解によって得られる、信号の2つのサブバンド、[50〜4000Hz]および[4000〜7000Hz]のそれぞれのADPCM符号化である。低帯域は、1サンプル当たり6、5および4ビットの埋め込み符号ADPCM符号化により符号化され、一方で、高帯域は、1サンプル当たり2ビットのADPCMコーダにより符号化される。全体のビットレートは、低帯域を復号化するために使用されるビット数に応じて、64、56または48bit/sとなる。
この符号化は、最初にISDN(サービス総合ディジタル網)において、その後、IPネットワークでの音声符号化の応用例において使用された。
例として、G.722標準では、図3に示されるような以下の方式で、8ビットが割り当てられる。
高帯域に対しては、Ih1およびIh2の2ビット。
低帯域に対しては、IL1、IL2、IL3、IL4、IL5、IL6の6ビット。
ビットIL5およびIL6は、データによって「盗まれる」か、またはデータによって置換される場合があり、低帯域エンハンスメントビットを構成する。ビットIL1、IL2、IL3、IL4は、低帯域コアビットを構成する。
したがって、G.722標準に従って量子化される信号のフレームは、8、7または6ビットで符号化される量子化インデックスからなる。インデックスの送信の周波数は8kHzであるので、ビットレートは、64、56または48kbit/sとなる。
多数のレベルを有する量子化器に関しては、量子化ノイズのスペクトルは、図4により示されるように、比較的平坦となる。信号のスペクトルもまた、図4に示される(ここでは、有声音信号ブロック)。このスペクトルは、大きなダイナミック振幅(約40dB)を有する。低エネルギー区域では、ノイズは、信号に非常に接近し、したがって、もはや必ずしもマスクされるわけではないことが理解され得る。その場合、それは、これらの領域、特に図4での周波数[2000〜2500Hz]の区域では、可聴となり得る。
したがって、符号化ノイズのシェーピングが必要である。埋め込み符号の符号化に適応する符号化ノイズシェーピングが、さらに望ましいことになる。
埋め込み符号を用いるPCM(「パルス符号変調」を表す)タイプの符号化に対するノイズシェーピング技術は、“ITU-T G.711.1勧告「Wideband embedded extension for G.711 pulse code modulation」または「G.711.1: A wideband extension to ITU-T G.711」、Y. Hiwasaki、S. Sasaki、H. Ohmuro、T. Mori、J. Seong、M. S. Lee、B. Kovesi、S. Ragot、J.-L. Garcia、C. Marro、L. M.、J. Xu、V. Malenovsky、J. Lapierre、R. Lefebvre、EUSIPCO、Lausanne、2008”で説明される。
このように、この勧告は、コアビットレート符号化に対する、符号化ノイズのシェーピングを伴う符号化を説明する。符号化ノイズをシェーピングするための知覚フィルタ(perceptual filter)が、逆コア量子化器から発生する過去の復号化信号(decoded signal)に基づいて計算される。したがって、コアビットレートのローカルデコーダは、ノイズシェーピングフィルタを計算することを可能にする。このように、デコーダでは、このノイズシェーピングフィルタを、コアビットレートの復号化信号に基づいて計算することが可能である。
エンハンスメントビットを送出する量子化器は、コーダで使用される。
コアのバイナリストリームおよびエンハンスメントビットを受信するデコーダは、コーダにおけるフィルタ計算と同じ方式で、コアビットレートの復号化信号に基づいて、符号化ノイズをシェーピングするためのフィルタを計算し、このフィルタを、エンハンスメントビットの逆量子化器からの出力信号に適用し、そしてシェーピングされた高ビットレート信号が、フィルタリングされた信号を復号化コア信号に加算することにより得られる。
このように、ノイズのシェーピングは、コアビットレート信号の知覚品質をエンハンスする。それは、エンハンスメントビットについて、品質の限定的なエンハンスメントを提供する。実際は、符号化ノイズのシェーピングは、エンハンスメントビットの符号化について実行されず、量子化器の入力は、コア量子化に対しては、エンハンスされる量子化に対してと同じである。
次いで、デコーダは、コアビットに加えて、エンハンスメントビットが復号化されるとき、適切に適応化されるフィルタリングを通じて、結果として得られる、誤った(spurious:不要の)構成要素を削除しなければならない。
デコーダでのフィルタの余分な計算は、デコーダの複雑さ(complexity)を増大させる。
この技術は、G.722またはG.727のデコーダタイプのすでに存在する標準のスケーラブルデコーダでは使用されない。したがって、既存の標準のスケーラブルデコーダとの互換性を維持しながら、どのようなビットレートでも信号の品質をエンハンスする要求が存在する。
仏国特許第2742568号(FR2742568)
X. Maitre、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月 ITU-T G.711.1勧告「Wideband embedded extension for G.711 pulse code modulation」 「G.711.1: A wideband extension to ITU-T G.711」、Y. Hiwasaki、S. Sasaki、H. Ohmuro、T. Mori、J. Seong、M. S. Lee、B. Kovesi、S. Ragot、J.-L. Garcia、C. Marro、L. M.、J. Xu、V. Malenovsky、J. Lapierre、R. Lefebvre、EUSIPCO、Lausanne、2008 ITU-T勧告G.711、「Pulse Code Modulation (PCM) of voice frequencies」
本発明は、この状況を改善することを目的とする。
この目的のために、本発明は、デジタル音声信号の階層符号化(hierarchical coding)の方法であって、入力信号の現在のフレームに対して、
− 現在のフレームの各サンプルに対するスカラ量子化インデックスを送出するコア符号化と、
− エンハンスメント信号の各符号化サンプル(coded sample)に対するスカラ量子化のインデックスを送出する、少なくとも1つのエンハンスメント符号化とを含む方法を提案する。この方法は、エンハンスメント符号化が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るステップを含み、前記エンハンスメント信号のスカラ量子化のインデックスが、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定されるというものである。
したがって、より高いビットレートのエンハンスメント信号の符号化ノイズのシェーピングが実行される。本発明の要旨を構成する合成ベースの分析スキームは、従来技術の符号化ノイズシェーピングの解決法の場合にあり得るような、デコーダで何らかの相補信号処理を実行することを必要とはしない。
したがって、デコーダで受信される信号は、何らかのノイズシェーピングの計算、または何らかの補正項(corrective term)を必要としない、コアビットレートの信号、および埋め込みビットレートの信号を復号化することができる標準デコーダにより、復号化され得ることになる。
したがって、復号化信号の品質は、デコーダで使用可能なビットレートが何であっても、エンハンスされる。
以下で述べられる様々な特定の実施形態は、上記で定義された方法のステップに対して、独立に、または相互に組み合わせて加えられ得る。
したがって、目標信号の決定の実施のモードは、現在のエンハンスメント符号化段階に対して、この方法が、現在のサンプルに対して、以下のステップ、すなわち、
− 階層符号化の入力信号を、前の符号化段階の符号化に基づいて、および、現在のエンハンスメント符号化段階の再構成信号の過去のサンプルに基づいて部分的に再構成される信号と組み合わせることにより、エンハンスメント符号化誤差信号を得るステップと、
− 得られたノイズシェーピングフィルタによる、目標信号を得るための、エンハンスメント符号化誤差信号のフィルタリングステップと、
− 前の段階の符号化から発生する再構成信号と、量子化ステップから発生する信号との加算による、現在のサンプルに対する再構成信号の計算ステップと、
− 量子化ステップから発生する信号に基づく、ノイズシェーピングフィルタのメモリの適応化ステップと
を含むというものである。
本明細書で説明される演算の構成は、複雑さが非常に低減した演算による、符号化ノイズのシェーピングをもたらす。
特定の実施形態では、可能なスカラ量子化値の組、および現在のサンプルに対する誤差信号の量子化値は、コアビットレートの量子化インデックスに関して計算されるレベル制御パラメータによりスケーリングされる、量子化再構成レベルを示す値である。
したがって、これらの値は、コア符号化の出力レベルに適応化される。
特定の実施形態では、エンハンスメント段階kに対する量子化再構成レベルを示す値は、Bがコア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の量子化再構成レベルを示す値との間の差分により定義され、B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを2つに分けることにより定義される。
さらには、エンハンスメント段階kに対する量子化再構成レベルを示す値は、メモリ空間に格納され、コアビットレートの量子化およびエンハンスメントのインデックスの関数として、インデックスが付与される。
エンハンスメント量子化器の出力値は、直接ROMに格納されるが、B+kビットを用いる量子化器の出力値を、B+k-1ビットを用いる量子化器の出力値から減算することにより、各サンプリング時点に対して再計算される必要はない。さらには、それらは、例えば、前の段階のインデックスにより容易にインデックスの付与が可能であるテーブル内に、2つずつ配置される。
特定の実施形態では、スカラ量子化の可能な値の数は、各サンプルに対して変動する。
したがって、エンハンスメントビットの数を、符号化されるべきサンプルの関数として適応させることが可能である。
別の変形の実施形態では、スカラ量子化インデックスを与える、前記エンハンスメント信号の符号化サンプルの数は、入力信号のサンプルの数よりも小さい。
これは、例えば、あるサンプルに対して、エンハンスメントビットの割り当て数が0に設定されるときの場合であり得る。
コア符号化の実施の可能なモードは、例えば、スカラ量子化および予測フィルタを使用するADPCM符号化である。
コア符号化の実施の別の可能なモードは、例えば、PCM符号化である。
コア符号化は、さらに、例えば、現在のサンプルに対して、以下のステップ、すなわち、
− 符号化ノイズに対する予測信号を、過去の量子化ノイズサンプルに基づいて、および、所定のノイズシェーピングフィルタによりフィルタリングされる量子化ノイズの過去のサンプルに基づいて得るステップと、
− 量子化されるべき修正入力信号を得るために、コア符号化の入力信号と符号化ノイズ予測信号とを組み合わせるステップと
を用いる符号化ノイズのシェーピングを含むことができる。
このように、複雑さがより少ない符号化ノイズのシェーピングが、コア符号化に対して実行される。
特定の実施形態では、ノイズシェーピングフィルタは、1つのARMAフィルタ、またはARMAフィルタの連続体により規定される。
したがって、分子の値および分母の値から構成される、このタイプの加重関数には、分母の値により信号スパイクを考慮し、分子の値によりこれらのスパイクを減衰させ、したがって、量子化ノイズの最適なシェーピングを与えるという利点がある。ARMAフィルタの縦続接続された連続体(cascaded succession)は、信号のスペクトルの包絡線をモデリングするための構成要素、および、周期性もしくは準周期性の構成要素により、マスキングフィルタのより良好なモデリングを可能にする。
特定の実施形態では、ノイズシェーピングフィルタは、分離したスペクトル傾斜(spectral slope)およびフォルマント形状の2つの縦続状態のARMAフィルタリングセルに分解される。
このように、各フィルタは、入力信号のスペクトル特性の関数として適応化され、したがって、様々なタイプのスペクトル傾斜を表す信号に適している。
有利に、エンハンスメント符号化により使用されるノイズシェーピングフィルタ(W(z))は、さらに、コア符号化により使用され、したがって、実施の複雑さが低減する。
特定の実施形態では、ノイズシェーピングフィルタは、様々な入力信号に最良に適応するように、前記入力信号の関数として計算される。
変形の実施形態では、ノイズシェーピングフィルタは、コア符号化によりローカルに復号化される信号に基づいて計算される。
本発明は、さらに、デジタル音声信号の階層コーダであって、入力信号の現在のフレームに対して、
− 現在のフレームの各サンプルに対するスカラ量子化インデックスを送出するコア符号化段階と、
− エンハンスメント信号の各符号化サンプルに対するスカラ量子化のインデックスを送出する、少なくとも1つのエンハンスメント符号化段階と
を備える階層コーダに関する。
このコーダは、エンハンスメント符号化段階が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るためのモジュール、および、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより、前記エンハンスメント信号のスカラ量子化のインデックスを送出する量子化モジュールを備えるというものである。
それは、さらに、コード命令を含むコンピュータプログラムであって、これらの命令がプロセッサにより実行される場合に、本発明による符号化方法のステップを実施するコンピュータプログラムに関する。
最後に、本発明は、説明されたようなコンピュータプログラムを記憶する、プロセッサにより読み取り可能な記憶手段に関する。
本発明の他の特性および利点は、単に限定的でない例として与えられ、添付図面に基づく以下の説明を読むことにより、より明瞭に明らかとなる。
従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのコーダを示す図である。 従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのデコーダを示す図である。 従来技術による、および先に説明されたような、埋め込み符号ADPCMタイプのコーダの量子化インデックスの例示的なフレームを示す図である。 本発明を実施しないコーダに存在する量子化ノイズのスペクトルに対する信号ブロックのスペクトルを示す図である。 本発明の一般的な実施形態による埋め込み符号コーダの、および符号化方法のブロック図を示す図である。 本発明によるエンハンスメント符号化段階の、およびエンハンスメント符号化方法のブロック図を示す図である。 本発明によるエンハンスメント符号化段階の、およびエンハンスメント符号化方法のブロック図を示す図である。 本発明による符号化から発生する信号の復号化に適応するデコーダの様々な構成を示す図である。 本発明によるコーダの、および本発明による符号化方法の第1の詳細な実施形態のブロック図を示す図である。 本発明によるコーダのコア符号化段階に対する符号化ノイズの例示的な計算を示す図である。 図9の符号化ノイズを計算するための詳細な関数を示す図である。 本発明の符号化方法による量子化再構成レベルの組の取得の例を示す図である。 本発明の符号化方法によるエンハンスメント信号の表現を示す図である。 本発明による符号化のためのマスキングフィルタの計算の第1の実施形態のステップを表すフローチャートを示す図である。 本発明による符号化のためのマスキングフィルタの計算の第2の実施形態のステップを表すフローチャートを示す図である。 本発明によるコーダの、および本発明による符号化方法の第2の詳細な実施形態のブロック図を示す図である。 本発明によるコーダの、および本発明による符号化方法の第3の詳細な実施形態のブロック図を示す図である。 本発明によるコーダの可能な実施形態を示す図である。
以下、この文書では、「予測」という用語は、過去のサンプルのみを使用する計算を説明するために、意図的に使用される。
次に、図5を参照して、本発明による埋め込み符号コーダが説明される。符号化が、1つの追加のサンプル当たり1ビットを与えるエンハンスメント段階で実行されることを留意することは重要である。この制約は、本明細書で、本発明の説明を簡素化するためにのみ有用である。しかしながら、以下で説明される本発明は、エンハンスメント段階が、1サンプル当たり1を超えるビットを与える場合に容易に一般化されることは明らかである。
このコーダは、例えば、標準化されたG.722もしくはG.727のコーダなどのADPCM符号化タイプ、または、G.711の標準化されたコーダなどのPCM(「パルス符号変調」)コーダの、Bビットの量子化を伴い、ブロック520の出力の関数として修正されるコアビットレート符号化段階500を備える。
510と符号が付けられたブロックは、符号化ノイズのシェーピング、すなわち、図8、15または16を参照して、後でより詳細に説明される、コア符号化のノイズのマスキングを伴う、このコア符号化段階を示す。
このように提示される本発明は、さらに、コア部分で符号化ノイズのマスキングが実行されない場合に関する。さらには、「コアコーダ」という用語が、本文書では広い意味で使用される。したがって、例えば、ITU-T G.722の56または64kbit/sのような既存のマルチビットレートのコーダは、「コアコーダ」であるとみなされ得る。極端には、0kbit/sのコアコーダを考えること、すなわち、まさしく、符号化の第1のステップから、本発明の要旨を構成するエンハンスメント符号化技術を適用することもまた可能である。後者の場合には、エンハンスメント符号化はコア符号化となる。
ここで図5を参照して説明される、ノイズのシェーピングを伴うコア符号化段階は、予測信号
を提供するために、量子化ノイズqB(n)に基づいて、および、フィルタリングされる量子化ノイズ
に基づいて予測Pr(z)を実行するフィルタリングモジュール520を備える。このフィルタリングされる量子化ノイズ
は、例えば、フィルタリングされるノイズのKMの部分予測を、図9を参照して後で説明されるような量子化ノイズに加算することにより得られる。
コア符号化段階は、入力として信号x(n)を受信し、出力として、量子化インデックスIB(n)、IB(n)に基づいて再構成される信号rB(n)、および、例えば図1を参照して説明されるようなADPCM符号化の場合には、量子化器のスケールファクタν(n)を提供する。
図5に示されるようなコーダは、さらに、複数のエンハンスメント符号化段階を備える。段階EA1(530)、段階EAk(540)および段階EAk2(550)が、ここに示される。
このように示されるエンハンスメント符号化段階は、図6aおよび6bを参照して、後で詳細に説明されることになる。
一般には、各エンハンスメント符号化段階kは、入力として信号x(n)、最適インデックスIB+k-1(n)、コア符号化のインデックスIB(n)と前のエンハンスメント段階のインデックスJ1(n)〜Jk-1(n)との連結(concatenation)、または同じことであるが、これらのインデックスの組、前のステップで再構成される信号rB+k-1(n)、マスキングフィルタのパラメータ、および適切ならば、適応符号化の場合にはスケールファクタν(n)を有する。
このエンハンスメント段階は、出力として、連結モジュール560でインデックスIB+k-1(n)と連結されることになる、この符号化段階に関するエンハンスメントビットに対する量子化インデックスJk(n)を提供する。エンハンスメント段階kは、さらに、出力として、再構成信号rB+k(n)を提供する。ここで、インデックスJk(n)は、インデックスnの各サンプルに対して1ビットを示すが、しかしながら、一般的な場合には、Jk(n)は、可能な量子化値の数が2より大きいならば、1サンプル当たり複数ビットを示すことができることに留意されたい。
一部の段階は、インデックスIB(n)と連結されることになる、送信されるべきビットJ1(n)〜Jk1(n)に対応し、それにより、結果として得られるインデックスが、後で図7において示され、かつ説明されるような標準デコーダにより復号化され得る。したがって、リモートデコーダを変更する必要はなく、さらには、リモートデコーダに、コーダで実行される処理を「通知する」ための追加の情報は、必要ではない。
他のビットJk1+1(n)〜Jk2(n)は、ビットレートを上昇させ、マスキングすることにより、エンハンスメントビットに対応し、図7を参照して説明される追加の復号化モジュールを必要とする。
図5のコーダは、さらに、入力信号に基づいて、または、図13および14を参照して後で説明されるようなコーダの合成フィルタの係数に基づいて、ノイズシェーピングフィルタまたはマスキングフィルタを計算するための、モジュール580を備える。モジュール580は、入力として、元の信号ではなく、ローカルに復号化された信号を有する場合があることに留意されたい。
ここで示されるようなエンハンスメント符号化段階は、復号化信号のビットレートが何であっても、デコーダを修正することなしに、したがって、デコーダでの何らかの余分な複雑さもなしに、デコーダで信号の向上された品質を提供するエンハンスメントビットを提供することを可能にする。
このように、本発明の一実施形態によるエンハンスメント符号化段階kを示す図5のモジュールEakが、次に、図6aを参照して説明される。
この符号化段階により実行されるエンハンスメント符号化は、出力として、可能な量子化値の組と、符号化ノイズシェーピングフィルタの使用により決定される目標信号との間の誤差を最小化する、インデックスおよび量子化値を送出する量子化ステップ
を含む。
埋め込み符号量子化器を備えるコーダが、ここでは考察される。
段階kは、エンハンスメントビットJk、またはビットJk(k=1〜GK)のグループを得ることを可能にする。
それは、符号化誤差信号eB+k(n)を与えるために、入力信号x(n)から、現在のフレームの、およびサンプルnに対する前の段階の信号rB+k-1(n)の、各前のサンプルn’=n-1〜n-NDに対して、段階kで合成される信号rB+k(n)を減算するためのモジュールEAk-1を備える。
図4を用いて示されるような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準(quadratic error criterion)を最小化することではなく、量子化ステップでは、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。
このように、段階kは、加重関数W(z)により誤差信号eB+k(n)をフィルタリングするためのフィルタリングモジュールEAk-2を備える。この加重関数は、さらに、コア符号化段階で、ノイズのシェーピングのために使用され得る。
ノイズシェーピングフィルタは、ここでは、スペクトル加重の逆関数に等しく、すなわち、次式のように表される。
このシェーピングフィルタは、ARMAタイプ(「自己回帰移動平均(AutoRegressive Moving Average)」)である。その伝達関数は、次数NNの分子および次数NDの分母から構成される。このように、ブロックEAk-1は、本質的には、HM(z)の分母に対応するフィルタW(z)の非再帰型(non-recursive)部分のメモリを定義する働きをする。W(z)の再帰型部分のメモリの定義は、簡潔化のために示されていないが、それは、
から、および、
から推定される。
このフィルタリングモジュールは、出力として、目標信号に対応する、フィルタリングされた信号
を与える。
スペクトル加重の役割は、符号化誤差のスペクトルをシェーピングすることであり、これは、加重誤差のエネルギーを最小化することにより実行される。
量子化モジュールEAk-3は、量子化出力の可能な値に基づいて、以下の式による加重誤差基準を最小化することに努める量子化ステップを実行する。
この式は、エンハンスメントビットが、各サンプルnに対して計算される場合を示す。
その場合に、量子化器の2つの出力値が考えられる(possible)。我々は、後で、量子化ステップの可能な出力値が如何にして定義されるかを理解することになる。
すなわち、このモジュールEAk-3は、第1の出力として、前の段階IB+k-1のインデックスと連結されるべき最適ビットJkの値を有し、そして第2の出力
として、最適インデックスJkに対する量子化器の出力信号を有する、エンハンスメント量子化
を実行する。ただし、ν(n)は、量子化器の出力レベルを適応させるために、コア量子化により定義されるスケールファクタを示す。
最後に、エンハンスメント符号化段階は、段階kでの合成信号(synthesized signal)rB+k(n)を与えるために、量子化誤差信号
を、前の段階で合成された信号rB+k-1(n)に加算するためのモジュールEAk-4を備える。
同等の方式で、rB+k(n)は、EAk-4の代わりに、インデックスIB+k(n)を復号化することにより、すなわち、任意には有限の精度で、
を計算することにより、および、予測
を加算することにより得られ得る。この場合は、Bビット、B+1〜を用いる量子化器の量子化値
をメモリに格納し、エンハンスメント量子化器の値を
により計算することが適切である。
n’=nに対してx(n’)-rB+k-1(n’)に等しい値を有していた信号eB+k(n)は、次のサンプリング時点に対して、以下の式に従って補足される(supplemented)。
ただし、eB+k(n)もまた、フィルタのメモリMA(「移動平均」を表す)である。したがって、メモリに保存されるべきサンプルの数は、ノイズシェーピングフィルタの分母の係数の数に等しい。
次いで、フィルタリングのAR(「自己回帰」を表す)部分のメモリは、以下の式に従って更新される。
複数のARMAセルを縦続状態に配置することによるフィルタリングの場合には、図10に関連して、フィルタの内部変数が、同様に適応化される。
インデックスnは、1単位だけ増分される。初期化ステップが最初のND個のサンプルに対して実行された後で、eB+k(n)の計算が、eB+k(n)に関して格納メモリをシフトすることにより(最古のサンプルを上書きすることを伴う)、および、値eB+k(n)=x(n)-rB+k-1(n)を空き状態のスロットに書き込むことによりなされることになる。
図6aに示される本発明は、等価の変形により実行され得ることが留意され得る。実際に、再構成信号は、単に、すでに利用可能なサンプル(過去のサンプルn’=n-1〜n-ND、前の段階の現在のサンプル、フィルタのメモリ)により決定される部分sdet(n)と、最適化されるべき現在のサンプルに単に依存して決定されるべき別の部分sopt(n)とに分解され得る。したがって、計算の負荷を最適化するために、入力信号x(n)と再構成信号rB+k(n)との間の加重誤差である、最小化されるべき誤差
の計算もまた、2つの部分に分解され得る。第1のステップでは、入力サンプルx(n)とsdet(n)との間の、W(z)による加重差分が計算される(図6aのモジュールEAK-1およびEAK-2)。このようにして得られる値
は、単一の目標値に減少する、時点nでの目標信号であり、必要であれば、それぞれの可能な量子化値
に対して1回だけ計算される。次に、最適化ループでは、すべての可能なスカラ量子化値の中から、ユークリッド距離の意味でこの目標値に最も近いものを、簡単に発見する必要がある。
目標値を計算するための別の変形は、2つの加重フィルタリングW(z)を実行することである。第1のフィルタリングは、入力信号と前の段階の再構成信号rB+k-1(n)との間の差分に加重する。第2のフィルタは、0入力であるが、これらのメモリは、
の助力により更新される。これら2つのフィルタリングの出力の間の差分は、同じ目標信号を与える。
図6aで説明される本発明の原理は、図6bで一般化される。ブロック601は、前の段階の符号化誤差εB+k-1(n)を与える。ブロック602は、すべての可能なスカラ量子化値
を1つずつ導出し、これらの値は、現在の段階の符号化誤差εB+k(n)を得るために、ブロック603により、εB+k-1(n)から減算される。この誤差は、ブロック602を制御するために、ノイズシェーピングフィルタW(z)により加重され(ブロック604)、最小化される(ブロック605)。最終的には、エンハンスメント符号化段階によりローカルに復号化される値は、
である。
ここで、表記B+kは、1サンプル当たりのビットレートがB+kビットであることを想定していることを留意することは重要である。したがって、図6は、1サンプル当たり単一のビットが、エンハンスメント符号化段階により加算され、そのため、ブロック602で、2つの可能な量子化値を含む場合について示している。図6bで説明されるエンハンスメント符号化が、1サンプル当たり、任意のビット数kを生成することができることは明らかであり、この場合には、ブロック602での可能なスカラ量子化値の数は2kである。
図7を参照して、次に、出願人は、本発明による、および図5を参照して説明されるようなコーダからの出力として得られる信号を復号化することができる、埋め込み符号デコーダの様々な構成を説明する。
実施される復号化デバイスは、信号送信ビットレートによって、および、例えば、信号が、例えばISDNネットワーク710から発信するか、それともIPネットワーク720から発信するかによる、信号の起源によって決まる。
低ビットレート(48、56または64kbit/s)での送信チャネルに対しては、k1=0、1、2であり、Bがコアビットレートのビット数であるB+k1ビットのバイナリ列を復号化するために、例えばG.722の標準化されたADPCMデコーダタイプの標準デコーダ700を使用することが可能になる。この復号化から発生する、復元される信号rB+k1(n)は、コーダで実施されるエンハンスメント符号化段階の効力によるエンハンスされた品質から利点を得ることになる。
より高いビットレート、80、96kbit/sでの送信チャネルに対しては、バイナリ列IB+k1+k2(n)が、標準デコーダ700のビットレートよりも大きなビットレートを有し、モードインジケータ740により示されるならば、予測信号
に加算されるときに、高ビットレートのエンハンスされた信号rB+k1+k2(n)を与えることになる量子化誤差を提供するために、図2を参照して説明されるB+1ビットおよびB+2ビットでの逆量子化に加えて、追加のデコーダ730が、IB+k1+k2(n)の逆量子化を実行する。
次に、本発明によるコーダの第1の実施形態が、図8を参照して説明される。この実施形態では、コアビットレート符号化段階800が、符号化ノイズシェーピングを伴うADPCMタイプの符号化を実行する。
コア符号化段階は、コア層の低ビットレートインデックスIB(n)による量子化誤差信号の前のサンプル
に基づいて、および、図1を参照して説明されたような再構成信号の前のサンプルrB(n’)(n’=n-1〜n-NP)に基づいて実行される信号予測
を計算するためのモジュール810を備える。
予測
を入力信号x(n)から減算するための減算モジュール801が、予測誤差信号
を得るために提供される。
コアコーダは、さらに、量子化ノイズの前のサンプルqB(n’)(n’=n-1〜n-NNH)に基づいて、およびフィルタリングされたノイズの前のサンプル
に基づいて実行される、ノイズ
を予測することPr(z)のためのモジュール802を備える。
ノイズ予測
を、予測誤差信号
に加算するための加算モジュール803が、さらに、eB(n)で示される誤差信号を得るために提供される。
コア量子化QBモジュール820は、量子化インデックスIB(n)を与えるために、入力として、誤差信号eB(n)を受信する。最適量子化インデックスIB(n)および量子化値
は、誤差基準
を最小化する。ただし、値
は、再構成レベルであり、ν(n)は、量子化器適応化モジュール804から発生するスケールファクタである。
G.722コーダに対する例として、コア量子化器QBの再構成レベルが、“X. Maitreによる論説(article)、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”の表VIによって定義される。
量子化モジュールQBによるBビット出力の量子化インデックスIB(n)は、送信チャネル840を介して、図7を参照して説明されるようなデコーダに送信される前に、エンハンスメントビットJ1〜JKと多重化モジュール830で多重化されることになる。
コア符号化段階は、さらに、量子化器の入力とその出力との間の差分である量子化ノイズ
を計算するためのモジュール805と、量子化ノイズを量子化ノイズの予測に加算することにより、フィルタリングされる量子化ノイズ
を計算するためのモジュール806と、信号の予測を量子化誤差に加算することにより、再構成信号
を計算するためのモジュール807とを備える。
量子化器QB適応
モジュール804は、次の時点n+1に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与える。
予測モジュール810は、再構成量子化誤差信号
のサンプル、および任意には、1+Pz(z)によりフィルタリングされる再構成量子化誤差信号
のサンプルに基づいた適応のための適応PAdaptモジュール811を備える。
後で詳細に説明されるモジュールCalc Mask850は、コア符号化段階およびエンハンスメント符号化段階の両方により、入力信号に基づいて、またはコア符号化により(コアビットレートで)ローカルに復号化される信号に基づいて、または簡易勾配(simplified gradient)アルゴリズムによりADPCM符号化で計算される予測フィルタ係数に基づいて使用され得る、符号化ノイズをシェーピングするためのフィルタを提供するように構成される。後者の場合には、ノイズシェーピングフィルタは、コアビットレート符号化に対して使用される予測フィルタの係数に基づいて、減衰定数を加えること、およびデエンファシスフィルタを加えることにより得られ得る。
さらには、エンハンスメント段階だけでマスキングモジュールを使用することが可能である。この代替方法は、コア符号化が1サンプル当たりでビットをほとんど使用しない場合に有利であり、この場合、符号化誤差は白色雑音ではなく、信号対雑音比は非常に低い。この状況は、G.722標準での高帯域(4000〜8000Hz)の1サンプル当たり2ビットのADPCM符号化で見られ、この場合には、フィードバックによるノイズシェーピングは、有効ではない。
図8のブロック802、803、805、806に対応するコア符号化のノイズシェーピングは、任意であることに留意されたい。図16に示されるような本発明は、ブロック801、804、807、810、811、820に削減されるADPCMのコア符号化に関してさえも適用される。
図9は、一般式が
であるARMA(「自己回帰移動平均」を表す)フィルタによって、量子化ノイズ
の予測の計算を実行するモジュール802をより詳細に説明する。
簡単のために、ここでは、z変換の表記が使用される。
一度に、および同時に、可聴周波数信号の短期間の特性、および長期間の特性を考慮することができるノイズのシェーピングを得るために、フィルタHM(z)が、縦続状態のARMAフィルタリングセル900、901、902により示される。
このフィルタの縦続状態から発生する、図9のフィルタリングされる量子化ノイズは、量子化ノイズQB(z)の関数として、次式で与えられることになる。
図10は、モジュールFk(z)901をより詳細に示す。このセルkの出力での量子化ノイズは、次式で与えられる。
k=1〜KMで繰り返すことが、
すなわち、
により与えられるノイズ予測
を用いた、
を与える。
したがって、図8によるコア符号化ノイズのシェーピングは、以下の式により有効であることが容易に確認される。
QB(z)=EQ(z)-EB(z) ・・・(14)
ただし、
である。
量子化ノイズはほぼ白色であるため、知覚される符号化ノイズのスペクトルは、フィルタ
によりシェーピングされ、したがって、より可聴でなくなる。
後で説明されるように、ARMAフィルタリングセルは、係数g1およびg2を以下の方式
で割り当てることにより、入力信号
の線形予測のための逆フィルタから推定され得る。
分子の値および分母の値から構成される、このタイプの加重関数には、分母の値により信号スパイクを考慮し、分子の値によりこれらのスパイクを減衰させ、したがって、量子化ノイズの最適なシェーピングを与えるという利点がある。g1およびg2の値は、
1>g2>g1>0
である。
特定の値g1=0は、純粋な自己回帰マスキングフィルタを与え、g2=0のそれは、MA移動平均フィルタを与える。
さらには、有声音信号の場合、および高忠実度のデジタル音声信号の場合には、信号の周期性を表す信号の微細構造に基づくわずかなシェーピングが、信号の高調波の間で知覚される量子化ノイズを低減する。エンハンスメントは、特に、例えば200Hzより大きな、比較的高い基本周波数すなわちピッチを有する信号の場合に重要である。
長期間のノイズシェーピングARMAセルは、次式で与えられる。
図8の説明に戻ると、コーダは、さらに、複数のエンハンスメント符号化段階を備える。2つの段階EA1およびEAkが、ここに示される。
エンハンスメント符号化段階EAkは、エンハンスメントビットJk、またはビットJk(k=1、GK)のグループを得ることを可能にし、図6aおよび6bを参照して説明されるようなものである。
この符号化段階は、符号化誤差信号eB+k(n)を与えるために、入力信号x(n)から、サンプリング時点n-1〜n-NDに対する段階kでの合成信号rB+k(n)と、時点nに対して段階k-1で合成される信号rB+k-1(n)とで構成される信号rB+k(n)を減算するためのモジュールEAk-1を備える。
加重関数W(z)によりeB+k(n)をフィルタリングするためのモジュールEAk-2もまた、符号化段階kに含まれる。この加重関数は、先に説明されたようなコア符号化により与えられるマスキングフィルタHM(z)の逆関数に等しい。モジュールEAk-2の出力では、フィルタリングされた信号
が得られる。
エンハンスメント符号化段階kは、j=0、1に対して、誤差基準
を最小化し、第1の出力として、前の段階のインデックスIB+k-1と連結されるべき最適ビットJkの値を有し、そして第2の出力
として、最適インデックスJkに対する量子化器からの出力信号を有する、エンハンスメント量子化
を実行するためのモジュールEAk-3を備える。
段階kは、さらに、段階kでの合成信号rB+k(n)を与えるために、量子化誤差信号
を、前の段階での合成信号rB+k-1(n)に加算するための加算モジュールEAk-4を備える。
次いで、単一のシェーピングARMAフィルタの場合には、フィルタリングされる誤差信号は、z変換の表記で次式により与えられる。
したがって、それぞれのサンプリング時点nに対しては、部分的な再構成信号rB+k(n)が、前の段階で再構成された信号rB+k-1(n)に基づいて、および、信号rB+k(n)の過去のサンプルに基づいて計算される。
この信号は、誤差信号eB+k(n)を与えるために、信号x(n)から減算される。
誤差信号は、フィルタリングARMAセルW1を有するフィルタによりフィルタリングされ、それにより次式が与えられる。
加重誤差基準は、量子化器の可能な出力の2つの値(または、複数ビットならばNG個の値)に対する二次誤差を最小化することに等しい。
この最小化ステップは、最適インデックスJk、および、最適インデックスに対する量子化値
であって、
とも示される値を与える。
マスキングフィルタが、複数の縦続状態のARMAセルからなる場合には、縦続接続したフィルタリングが実行される。
例えば、縦続状態の短期間のフィルタリングおよびピッチのセルに対して、我々は次式を得ることになる。
第1のフィルタリングセルの出力は、次式に等しくなる。
そして、第2のセルの出力は、次式で与えられる。
が、基準を最小化することにより得られると、eB+k(n)は、
をeB+k(n)から差し引くことにより適応化され、次いで、格納メモリが左にシフトされ、値rB+k+1(n+1)が、次の時点n+1に対して直近の位置に入れられる。
その後、フィルタのメモリが、次式により適応化される。
前の手順が、一般的な場合には、次式
のように繰り返される。
このように、エンハンスメントビットは、縦続状態のエンハンスメント段階において、ビット単位で、またはビットのグループ単位で得られる。
コーダのコアビットおよびエンハンスメントビットが、図1に示されるように、誤差信号e(n)を量子化することにより直接得られる従来技術とは対照的に、本発明によるエンハンスメントビットは、標準デコーダの出力におけるエンハンスメント信号が、量子化ノイズのシェーピングを伴って再構成されるように計算される。
コア量子化器の出力で得られるインデックスIB(n)を知ることにより、および、B+1ビットを用いるADPCMタイプの量子化器が埋め込み符号量子化器であるため、2つの出力値のみが、B+1ビットを用いる量子化器に対して考えられる(possible)。
同じ論法が、B+kビットでのエンハンスメント段階の出力に関して、B+k-1ビットでのエンハンスメント段階の関数として適用される。
図11は、B=4ビットに対するBビットを用いるコア量子化器の最初の4つのレベル、ならびに、G.722コーダの低帯域の符号化のB+1およびB+2ビットを用いる量子化器のレベル、ならびに、B+2ビットに対するエンハンスメント量子化器の出力値を示す。
この図に示されるように、B+1=5ビットを用いる埋め込み量子化器は、B=4ビットを用いる量子化器のレベルを2つに分けることにより得られる。B+2=6ビットを用いる埋め込み量子化器は、B+1=5ビットを用いる量子化器のレベルを2つに分けることにより得られる。
本発明の実施形態では、エンハンスメント段階kに対する量子化再構成レベルを示す値は、Bがコア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の量子化の再構成レベルを示す値との間の差分により定義され、B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを2つに分けることにより定義される。
したがって、我々は、以下の式を得る。
は、B+kビットを用いる埋め込み量子化器の可能な再構成レベルを示し、
は、B+k-1ビットを用いる埋め込み量子化器の再構成レベルを示し、
は、段階kに対するエンハンスメント項または再構成レベルを示す。例として、段階k=2の、すなわちB+k=6に対する出力でのレベルが、B+k=5ビットに対する埋め込み量子化器の関数として、図11で与えられる。
B+kビットを用いる量子化器の可能な出力は、次式で与えられる。
ただし、ν(n)は、固定した量子化器の出力レベルを適応させるために、コア符号化により定義されるスケールファクタを示す。
従来技術のスキームでは、B、B+1〜B+Kビットを用いる量子化器に対する量子化は、量子化されるべき値e(n)が位置する、B+kビットを用いる量子化器の判定範囲をタグ付けすることにより、1回だけ実行された。
本発明は、異なるスキームを提案する。B+k-1ビットを用いる量子化器から発生する量子化値を知ることにより、量子化器の入力での信号
の量子化は、量子化誤差を最小化することにより、および、判定しきい値を呼び出すことなしに処理され、それにより、有利に、積
の固定小数点実装(fixed-point implementation)に対する計算ノイズを、以下のように低減することを可能にする。
図4を用いて示されるような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準を最小化することではなく、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。
使用されるスペクトル加重関数はW(z)であり、これは、さらに、コア符号化段階で、ノイズシェーピングのために使用され得る。
図8の説明に戻ると、復元されるコア信号は、予測と逆量子化器の出力との和に等しく、すなわち、
であることが理解される。
信号予測は、コアADPCMコーダに基づいて実行されるため、段階kで可能な2つの再構成信号は、以下の式
により、段階k-1で実際に再構成される信号の関数として与えられる。
これから、段階kで最小化されるべき誤差基準が推定される。
先に説明されたような平坦なスペクトルで量子化ノイズを引き起こすことになる、二次誤差基準を最小化することではなく、コア符号化についてと同じように、加重二次誤差基準が最小化されることになり、その結果、スペクトルがシェーピングされたノイズは、より可聴でなくなる。使用されるスペクトル加重関数はW(z)であり、これは、与えられた例でコア符号化のためにすでに使用されているが、しかしながら、この加重関数を、エンハンスメント段階だけで使用することが可能である。
図12によれば、信号
は、2つの信号、すなわち、n’<nに対してはすべての値
の連結を示し、n’=nに対しては0に等しい信号
と、n’=nに対しては
に等しく、n’<nに対しては0である信号
との和に等しいものとして定義される。
次いで、誤差基準は、z変換の領域で解釈する方が容易であり、以下の式で与えられる。
ただし、
は、
のz変換である。
を分解することにより、我々は、次式を得る。
例えば、この基準を最小化するために、我々は、量子化値がまだ不明であるので、信号
を、
で計算することにより開始する。前の段階の信号の和、および
の和は、段階kの再構成信号に等しい。
したがって、
は、
のように、n’<nに対しては、rB+k(n’)に等しい信号のz変換であり、n’=nに対しては、rB+k-1(n’)に等しい。
プロセッサにおける実施に関しては、信号rB+k(n)は、一般には明示的に計算されることにはならないが、誤差信号eB+k(n)は、有利に計算されることになり、これは、x(n)とrB+k(n)との間の差分、すなわち、
eB+k(n’)=x(n’)-rB+k(n’) n’=n-1〜n-ND
=x(n’)-rB+k-1(n’) n’=n ・・・(41)
である。
eB+k(n)は、rB+k-1(n)に基づいて、およびrB+k(n)に基づいて構成され、後に続くことになるフィルタリングのためにメモリに保存されるべきサンプルの数は、ND個のサンプル、マスキングフィルタの分母の係数の数である。
フィルタリングされる誤差信号
は、次式に等しくなる。
加重二次誤差基準は、これから推定される。
最適インデックスJkは、基準
をj=0、1に対して最小化するものであり、したがって、スカラ量子化
を、B+kビットを用いるスカラ量子化器の再構成レベルに基づいて計算される2つのエンハンスメントレベル
に基づいて実行し、最適コアインデックスおよびインデックスJi(i=1〜k-1)、または同じことであるが、IB+k-1を知る。
最適インデックスに対する量子化器の出力値は、
に等しく、時点nでの再構成信号の値は、次式で与えられることになる。
量子化出力
を知ることにより、差分信号eB+k(n)は、サンプリング時点nに対して更新される。
そして、フィルタのメモリが適応化される。
nの値は、1単位だけ増分される。次いで、eB+k(n)の計算が、きわめて単純であることが理解される。eB+k(n)のための格納メモリを、左に1スロットだけシフトすることにより、最古のサンプルを脱落させ、直近のサンプルrB+k-1(n+1)として、その時まで不明である量子化値を書き込めば十分である。メモリをシフトすることは、ポインタを賢明に使用することにより回避され得る。
図13および図14は、マスキングフィルタ計算モジュール850により実施されるマスキングフィルタ計算の実施の2つのモードを示す。
図13に示される実施の第1のモードでは、前のフレームのサンプルのセグメントS(n)(n=-Ns〜-1、0〜NT)で補足される現在フレームのブロックに対応する信号の現在ブロックが考慮される。
マスキングフィルタのスペクトルのスパイクを強調するために、信号は、フィルタA1(z)による、E60における相関係数の計算の前に、あらかじめ処理され(プリエンファシス処理)、このフィルタA1(z)の1つまたは複数の係数は、固定されるか、または仏国特許第2742568号(FR2742568)で説明されるような線形予測により適応化されるかのいずれかである。
プリエンファシスが使用される場合には、分析されるべき信号SP(n)は、次式の逆フィルタリングにより計算される。
SP(z)=A1(z)S(z)
その後、信号ブロックは、E61において、従来技術から知られるような、ハニングウィンドウ、またはサブウィンドウの連結から構成されるウィンドウにより加重される。
その後、Kc2+1の相関係数は、E62において、次式により計算される。
プリエンファシスされる信号の包絡線をモデリングする、(自己回帰を表す)ARフィルタA2(z)の係数が、E63において、レビンソン-ダービンのアルゴリズムにより与えられる。
したがって、フィルタA(z)が、E64において得られ、前記フィルタは、入力信号の包絡線をモデリングする伝達関数
を有する。
この計算が、本発明によるコーダの2つのフィルタ1-A1(z)および1-A2(z)に対して実施されるとき、それにより、シェーピングフィルタは、E65において、次式により得られる。
定数gN1、gD1、gN2およびgD2は、マスキングフィルタのスペクトルを適合させることを可能にし、特に、最初の2つは、マスキングフィルタのスペクトルの傾斜を調整することを可能にする。
このように、マスキングフィルタは、傾斜フィルタおよびフォルマントフィルタが分離された、縦続接続する2つのフィルタにより構成されて得られる。各フィルタが入力信号のスペクトル特性の関数として適応化されるこのモデリングは、特に、任意のタイプのスペクトル傾斜を表す信号に適応化される。gN1およびgN2が0である場合には、第1近似としては十分である、2つの自己回帰フィルタの縦続マスキングフィルタリングが得られる。
複雑さの低いマスキングフィルタの第2の例示的な実施が、図14を参照して説明される。
ここでの原理は、ARMAフィルタの合成フィルタを、入力信号の傾斜に依存している補償フィルタにより適用される強調解除(deaccentuation)を伴う復号化信号の再構成のために、直接使用することである。
マスキングフィルタの式は、次式で与えられる。
G.722、G.726およびG.727標準では、ADPCMのARMA予測器は、分母に2つの係数を有する。この場合、E71において計算される補償フィルタは、次式の形式になる。
そして、E70において与えられるフィルタPz(z)およびPP(z)は、E72において与えられる減衰定数gZ1およびgP1により制約されるそれらの変形で置換されることになり、それにより、次式の形式のノイズシェーピングフィルタを与える。
pCom(i)=0 i=1、2
を用いることにより、ARMAセルからなるマスキングフィルタの単純化された形式が得られる。
マスキングフィルタの別の非常に単純な形式は、わずかな減衰を伴うARMA予測器の分母のみを、次式
のように、例えばgP=0.92で用いることにより得られるものである。
信号の部分的な再構成のためのこのARフィルタは、低減された複雑さにつながる。
特定の実施形態では、および、各サンプリング時点でフィルタを適応させることを回避するために、平滑化効果を保存するように、1つの信号フレームで、または1フレーム当たり複数回減衰されるべきフィルタの係数を凍結することが可能になる。
平滑化を実行する1つの方法は、量子化器の入力での信号に関するダイナミック振幅の急な変動を検出することであり、または、等価であるが、しかし複雑さが最小である、直接に量子化器の出力におけるインデックスに関する方法によるものである。インデックスの2つの急な変動の間で、スペクトル特性の変動がより少なく、したがって、マスキングの目的でより良好に適応化されるADPCM係数を有する区域が得られる。
量子化ノイズの長期間のシェーピングに対するセルの係数の計算
は、有声音に対する周期的な構成要素を含む量子化器の入力信号に基づいて実行される。周期的な信号に対して、特に有声の音声信号に対して、品質において価値のあるエンハンスメントを得ることを望むならば、長期間のノイズシェーピングが重要であることが留意され得る。これは、実際に、その合成モデルが何らかの長期間の予測器を備えないコーダに関して、周期的な信号の周期性を考慮する唯一の方法である。
ピッチの周期は、例えば、図8の量子化器QBの入力eB(n)での長期間の二次予測誤差を最小化することにより、相関係数
を最大化することにより計算される。
ピッチは、次のようなものである。
Cor(Pitch)=Max{Cor(i)} i=PMin〜PMax
マスキングフィルタを生成するために使用されるピッチ予測利得Corf(i)は、次式により与えられる。
長期間のマスキングフィルタの係数は、
p2MP(i)=g2PitchCorf(Pitch+i) i=-MP〜MP
および、
p1MP(i)=g1PitchCorf(Pitch+i) i=-MP〜MP
により与えられることになる。
ピッチの値の計算の複雑さを低減するためのスキームが、“ITU-T G.711.1標準「Wideband embedded extension for G.711 pulse code modulation」”の図8-4により説明される。
図15は、本発明によるコーダの第2の実施形態を提案する。
この実施形態は、図8を参照して説明されるフィルタリングモジュールの代わりに、予測モジュールを使用し、どちらも、コア符号化段階に対するもの、およびエンハンスメント符号化段階に対するものである。
この実施形態では、コア量子化ノイズシェーピングを伴うADPCMタイプのコーダは、入力信号x(n)と低ビットレート合成信号rB(n)との間の差分である、再構成ノイズを予測するための予測モジュール1505のPD(z)[X(z)-RB(z)]と、予測を入力信号x(n)に加算するための加算モジュール1510とを備える。
それは、さらに、図8を参照して説明されるものと同一である、信号
に対する予測モジュール810であって、低ビットレート量子化インデックスIB(n)により量子化される誤差信号の前のサンプル
に基づいて、および、再構成信号の前のサンプルrB(n’)(n’=n-1〜n-NP)に基づいて、予測を実行する予測モジュールを備える。予測
を修正入力信号x(n)から減算するための減算モジュール1520は、予測誤差信号を提供する。
コアコーダは、さらに、量子化ノイズの前のサンプルqB(n’)(n’=n-1〜n-NNH)に基づいて実行されるノイズ予測を計算するためのモジュールPN(z)1530と、このようにして得られる予測を、eB(n)で示される誤差信号を得るために、予測誤差信号から減算するための減算モジュール1540とを備える。
コア量子化モジュールQBは、1550で、二次誤差基準
の最小化を実行する。ただし、値
は、再構成レベルであり、ν(n)は、量子化器適応化モジュール1560から発生するスケールファクタである。量子化モジュールは、入力として、誤差信号eB(n)を受信し、それにより、出力として、量子化インデックスIB(n)および量子化信号
を与える。G.722に対する例として、コア量子化器QBの再構成レベルが、“X. Maitreによる論説、「7 kHz audio coding within 64 kbit/s」、IEEE Journal on Selected Areas in Communication、第6-2巻、1988年2月”の表VIによって定義される。
量子化モジュールQBの出力におけるBビットの量子化インデックスIB(n)は、送信チャネル840を介して、図7を参照して説明されるようなデコーダに送信される前に、エンハンスメントビットJ1〜Jkと多重化モジュール830で多重化されることになる。
量子化ノイズを計算するためのモジュール1570は、量子化器の入力と量子化器の出力との間の差分
を計算する。
モジュール1580は、信号の予測を量子化誤差に加算することにより、再構成信号
を計算する。
量子化器の適応化モジュールQAdapt1560は、次の時点に対する、スケールファクタとも呼ばれるレベル制御パラメータν(n)を与える。
予測モジュールの適応化モジュールPAdapt811は、再構成信号rB(n)の過去のサンプルに基づいて、および、再構成量子化誤差信号
に基づいて、適応化を実行する。
エンハンスメント段階EAkは、信号
を与えるために、先行の段階で再構成された信号rB+k-1(n)を、入力信号x(n)から減算するためのモジュールEAk-10を備える。
信号
のフィルタリングは、フィルタリングモジュールEAk-11によって、フィルタ
により、フィルタリングされた信号
を与えるために実行される。
予測信号
を計算するためのモジュールEAk-12が、さらに提供され、この計算は、量子化誤差信号の量子化された前のサンプル
に基づいて、および、
によりフィルタリングされるこの信号のサンプルに基づいて実行される。エンハンスメント段階EA-kは、さらに、目標信号
を与えるために、予測
を、信号
から減算するための減算モジュールEA-k13を備える。
エンハンスメント量子化モジュールEAk-14
は、二次誤差基準
を最小化するステップを実行する。
このモジュールは、入力として、信号
を受信し、第1の出力として、量子化信号
を提供し、そして第2の出力として、インデックスJkを提供する。
B+kビットを用いる埋め込み量子化器の再構成レベルは、B+k-1ビットを用いる量子化器の埋め込み出力レベルを2つに分けることにより計算される。B+kビットを用いる埋め込み量子化器のこれらの再構成レベルと、B+k-1ビットを用いる量子化器の再構成レベルとの間の差分値が計算される。この差分値
は、その後1回限りでプロセッサのメモリに格納され、コア量子化インデックスと、前の段階のエンハンスメント量子化器のインデックスとの組み合わせによりインデックスが付与される。
こうして、これらの差分値は、可能な量子化値を得るために、段階kの量子化モジュールにより使用される辞書(dictionary)を構成する。
量子化器の出力における信号
を、予測
に加算するための加算モジュールEAk-15が、さらに、段階kでの再構成信号rB+k(n)を与えるために、先行の信号を前の段階で再構成された信号rB+k-1(n)に加算するためのモジュールEAk-16と同様に、エンハンスメント段階kに統合される。
図8を参照して説明されるコーダについてと同じように、先に詳細に説明されたモジュールCalc Mask850は、入力信号に基づいて(図13)か、または図14を参照して説明されるようなADPCM合成フィルタの係数に基づいてかのどちらかで、マスキングフィルタを提供する。
このように、エンハンスメント段階kは、現在のサンプルに対して、以下のステップ、すなわち、
− 階層符号化の入力信号x(n)と、前のエンハンスメント符号化段階のエンハンスメント符号化から発生する再構成信号rB+k-1(n)との間の差分を計算することにより、差分信号
を得るステップと、
− 所定のマスキングフィルタW(z)による差分信号のフィルタリングステップと、
− 目標信号
を得るための、予測信号
の、フィルタリングされた差分信号
からの減算ステップと、
− 信号
を、量子化ステップから発生する信号
に加算することによる、
によりフィルタリングされる量子化器の出力での信号の計算ステップと、
− 前のエンハンスメント符号化段階のエンハンスメント符号化から発生する再構成信号と、前のフィルタリングされた信号とを加算することによる、現在のサンプルに対する再構成信号rB+k(n)の計算ステップと、を実施する。
図15は、単一のARMAセルからなるマスキングフィルタに関して、説明を簡単にする目的で与えられる。縦続状態の複数のARMAセルへの一般化は、式7から式17により説明されると共に、図9および図10で説明されるスキームに従って行われることになることが理解される。
マスキングフィルタが、1-PD(z)タイプのただ1つのセルを備える、すなわちPN(z)=0である場合には、
の寄与が、
から差し引かれることになり、または、さらに良好には、量子化器の入力信号は、EAk-11およびEAk-13を
により置換することによって与えられることになる。
縦続状態の複数のセルARへの一般化は、式7から式17により説明されると共に、図9および図10で説明されるスキームに従って行われることになることが理解される。
図16は、本発明の第3の実施形態を示し、今回はPCMタイプのコア符号化段階に関する。コア符号化段階1600は、ノイズ
の予測を、G.711の標準化されたPCMの量子化ノイズの前のサンプル
に基づいて、および、フィルタリングされたノイズの前のサンプル
に基づいて計算する予測モジュールPr(z)1610による符号化ノイズのシェーピングを含む。
図16におけるブロック1610、1620、1640および1650に対応するコア符号化のノイズシェーピングは、任意であることに留意されたい。図16で示されるような発明は、ブロック1630に削減されるPCMコア符号化に関してさえも適用される。
モジュール1620は、e(n)で示される誤差信号を得るために、予測
の、入力信号x(n)への加算を実行する。
コア量子化モジュール
1630は、量子化インデックスIB(n)を与えるために、入力として、誤差信号e(n)を受信する。最適量子化インデックスIB(n)および量子化値
は、誤差基準
を最小化する。ただし、値
は、G.711のPCM量子化器の再構成レベルである。
例として、B=8に対するG.711標準のコア量子化器
の再構成レベルは、“ITU-T勧告G.711、「Pulse Code Modulation (PCM) of voice frequencies」”の、A則(A-law)に対しては表1a、およびμ則(μ-law)に対しては表2a、により定義される。
量子化モジュール
の出力におけるBビットの量子化インデックスIB(n)は、多重化モジュール830で、送信チャネル840を介して、G.711タイプの標準デコーダに送信される前に、エンハンスメントビットJ1〜JKと連結されることになる。
量子化ノイズを計算するためのモジュール1640は、PCM量子化器の入力と、量子化された出力との間の差分
を計算する。
フィルタリングされた量子化ノイズを計算するためのモジュール1650は、量子化ノイズの、量子化ノイズの予測への加算
を実行する。
エンハンスメント符号化は、中間のビットレートに対する再構成ノイズの最適なシェーピングを保持しながら、量子化ビットを連続的に加算することにより、復号化信号の品質をエンハンスするものである。
エンハンスメントPCMビットJk、またはビットJk(k=1、GK)のグループを得ることを可能にする段階kは、ブロックEAkにより説明される。
このエンハンスメント符号化段階は、図8を参照して説明されるそれに類似する。
それは、符号化誤差信号eB+k(n)を与えるために、サンプルn-ND〜n-1に対して段階kで合成される信号rB+k(n)と、時点nに対して段階k-1で合成される信号rB+k-1(n)とで構成される信号rB+k(n)から、入力信号x(n)を減算するための減算モジュールEAk-1を備える。
それは、さらに、フィルタリングされた信号
を与えるために、マスキングフィルタHM(z)の逆関数に等しい加重関数W(z)によりeB+k(n)をフィルタリングするためのフィルタリングモジュールEAk-2を備える。
量子化モジュールEAk-3は、j=0、1に対する、誤差基準
の最小化を実行し、第1の出力として、前のステップのPCMインデックスIB+k-1と連結されるべき最適PCMビットJkの値を有し、そして第2の出力
として、最適PCMビットJkに対するエンハンスメント量子化器の出力信号を有する、エンハンスメント量子化
を実行する。
量子化誤差信号
を、前のステップで合成された信号rB+k-1(n)に加算するための加算モジュールEAk-4は、ステップkでの合成信号rB+k(n)を与える。信号eB+k(n)およびフィルタのメモリは、図6および図8に関して前に説明されたように適応化される。
図8を、および図15を参照して説明されるものと同様にして、モジュール850は、コア符号化のため、および、エンハンスメント符号化のため、の両方のために使用されるマスキングフィルタを計算する。
図8、15または16で示される他の変形の階層コーダを考察することが可能である。ある変形では、エンハンスメント符号化における可能な量子化値の数は、各符号化サンプルに対して変動する。エンハンスメント符号化は、符号化されるべきサンプルの関数として可変のビットの数を使用する。割り当てられるエンハンスメントビットの数は、固定の割り当て規則、または可変の割り当て規則に従って適応化され得る。例示的な可変の割り当ては、例えば、ITU-T G.711.1標準での低帯域のエンハンスメントPCM符号化により与えられる。好ましくは、割り当てアルゴリズムは、それが可変であるならば、リモートデコーダに利用可能な情報を使用しなければならず、それにより、追加の情報が送信される必要がなく、これは、例えば、ITU-T G.711.1標準での場合である。
同様に、および別の変形では、エンハンスメント符号化でスカラ量子化インデックス(Jk(n))を与える、エンハンスメント信号の符号化サンプルの数は、入力信号のサンプルの数よりも小さくすることができる。この変形は、エンハンスメントビットの割り当て数があるサンプルに対して0に設定される場合に、前の変形から推定される。
次に、本発明によるコーダの例示的な実施形態が、図17を参照して説明される。
ハードウェアの点からは、本発明の趣旨内で、第1、第2または第3の実施形態に従って説明されたようなコーダは、典型的には、メモリブロックBMと協働するプロセッサμPを備え、このメモリブロックBMは、格納ならびに/またはワークのメモリ、ならびに、例えば、先行する符号化段階の量子化値、そうでなければ、量子化再構成のレベルの辞書、もしくは、図6、8、15および16を参照して説明されるような符号化方法の実施のために必要な他の任意のデータを格納するための手段を装う上述のバッファメモリMEMを含む。このコーダは、入力として、デジタル信号x(n)の連続的なフレームを受信し、連結された量子化インデックスIB+Kを送出する。
本発明による方法のステップの実施のためのコード命令であって、これらの命令が、コーダのプロセッサμPにより実行され、ならびに特に、コアビットレートと呼ばれる所定のビットレートでの符号化、現在のフレームの各サンプルに対するスカラ量子化インデックスを送出すること、および、エンハンスメント信号の各符号化サンプルに対するスカラ量子化インデックスを送出する、少なくとも1つのエンハンスメント符号化であるときに、メモリブロックBMは、これらのコード命令を含むコンピュータプログラムを含むことができる。このエンハンスメント符号化は、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタを得るステップを含む。前記エンハンスメント信号のスカラ量子化のインデックスは、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定される。
より一般には、コンピュータまたはプロセッサにより読み取り可能であり、コーダに統合される場合もあればされない場合もあり、任意には取り外し式である記憶手段が、本発明による符号化方法を実施するコンピュータプログラムを記憶する。
例えば、図8、15または16は、そのようなコンピュータプログラムのアルゴリズムを例証することができる。
500 コアビットレート符号化段階
510 ブロック
520 ブロック、フィルタリングモジュール
530 段階EA1
540 段階EAk
550 段階EAk2
560 連結モジュール
580 モジュール
601〜606 ブロック
700 標準デコーダ
710 ISDNネットワーク
720 IPネットワーク
730 追加のデコーダ
740 モードインジケータ
800 コアビットレート符号化段階
801 減算モジュール、ブロック
802 モジュール、ブロック
803 加算モジュール、ブロック
804 量子化器適応化モジュール、ブロック
805、806 モジュール、ブロック
807 モジュール、ブロック
810 モジュール、予測モジュール、ブロック
811 適応PAdaptモジュール、ブロック
820 コア量子化QBモジュール、ブロック
830 多重化モジュール
840 送信チャネル
850 モジュール、マスキングフィルタ計算モジュール、モジュールCalc Mask
900 ARMAフィルタリングセル
901 ARMAフィルタリングセル、モジュールFk(z)
902 ARMAフィルタリングセル
1505 予測モジュール
1510 加算モジュール
1520 減算モジュール
1530 モジュールPN(z)
1540 減算モジュール
1550 コア量子化モジュール
1560 量子化器適応化モジュール、適応化モジュールQAdapt
1570、1580 モジュール
1600 コア符号化段階
1610 予測モジュールPr(z)、ブロック
1620 モジュール、ブロック
1630 コア量子化モジュール、ブロック
1640、1650 モジュール、ブロック

Claims (15)

  1. デジタル音声信号の階層符号化の方法であって、入力信号の現在のフレームに対して、
    − 前記現在のフレームの各サンプル(x(n))に対するスカラ量子化インデックス(IB(n))を送出するコア符号化と、
    − エンハンスメント信号
    の各符号化サンプルに対するスカラ量子化
    のインデックス(Jk(n))を送出する、少なくとも1つのエンハンスメント符号化とを含み、
    前記エンハンスメント符号化が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタ(W(z))を得るステップを含み、前記エンハンスメント信号のスカラ量子化
    の前記インデックス(Jk(n))が、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより決定されることを特徴とする方法。
  2. 現在のエンハンスメント符号化段階に対する前記目標信号の前記決定が、現在のサンプルに対して、以下のステップ、すなわち、
    − 前記階層符号化の前記入力信号(x(n))を、前の符号化段階の符号化に基づいて、および、前記現在のエンハンスメント符号化段階の再構成信号の過去のサンプルに基づいて部分的に再構成される信号と組み合わせることにより、エンハンスメント符号化誤差信号(eB+k(n))を得るステップと、
    − 得られた前記ノイズシェーピングフィルタ(W(z))による、前記目標信号
    を得るための、前記エンハンスメント符号化誤差信号のフィルタリングステップと、
    − 前の符号化段階の前記符号化から発生する前記再構成信号(rB+k-1(n))と、量子化ステップ
    から発生する信号との加算による、前記現在のサンプルに対する前記再構成信号(rB+k(n))の計算ステップと、
    − 前記量子化ステップから発生する前記信号に基づく、前記ノイズシェーピングフィルタのメモリの適応化ステップと
    を含むことを特徴とする、請求項1に記載の方法。
  3. 前記可能なスカラ量子化値の組、および前記現在のサンプルに対する誤差信号の量子化値が、コアビットレートの量子化インデックスに関して計算されるレベル制御パラメータによりスケーリングされる、量子化再構成レベルを示す値であることを特徴とする、請求項1に記載の方法。
  4. エンハンスメント段階kに対する量子化再構成レベルを示す値が、Bが前記コア符号化のビット数を示すB+kビットを用いる埋め込み量子化器の前記量子化の前記再構成レベルを示す値と、B+k-1ビットを用いる埋め込み量子化器の前記量子化再構成レベルを示す値との間の差分により定義され、B+kビットを用いる前記埋め込み量子化器の前記再構成レベルが、B+k-1ビットを用いる前記埋め込み量子化器の前記再構成レベルを2つに分けることにより定義されることを特徴とする、請求項3に記載の方法。
  5. 前記エンハンスメント段階kに対する量子化再構成レベルを示す値が、メモリ空間に格納され、前記コアビットレートの量子化およびエンハンスメントのインデックスの関数として、インデックスが付与されることを特徴とする、請求項4に記載の方法。
  6. スカラ量子化の可能な値の数が、各サンプルに対して変動することを特徴とする、請求項1に記載の方法。
  7. 前記スカラ量子化インデックス(Jk(n))を与える、前記エンハンスメント信号の符号化サンプルの数が、前記入力信号のサンプルの数よりも小さいことを特徴とする、請求項1に記載の方法。
  8. 前記コア符号化が、スカラ量子化および予測フィルタを使用するADPCM符号化であることを特徴とする、請求項1に記載の方法。
  9. 前記コア符号化が、PCM符号化であることを特徴とする、請求項1に記載の方法。
  10. 前記コア符号化が、さらに、現在のサンプルに対して、以下のステップ、すなわち、
    − 前記符号化ノイズ
    に対する予測信号を、過去の量子化ノイズサンプルに基づいて、および、所定のノイズシェーピングフィルタによりフィルタリングされる量子化ノイズの過去のサンプルに基づいて得るステップと、
    − 量子化されるべき修正入力信号を得るために、前記コア符号化の前記入力信号と前記符号化ノイズ予測信号とを組み合わせるステップと
    を含むことを特徴とする、請求項8または9に記載の方法。
  11. 前記エンハンスメント符号化により使用される前記ノイズシェーピングフィルタ(W(z))が、さらに、前記コア符号化により使用されることを特徴とする、請求項10に記載の方法。
  12. 前記ノイズシェーピングフィルタが、前記入力信号の関数として計算されることを特徴とする、請求項1または10に記載の方法。
  13. 前記ノイズシェーピングフィルタが、前記コア符号化によりローカルに復号化される信号に基づいて計算されることを特徴とする、請求項1または10に記載の方法。
  14. デジタル音声信号の階層コーダであって、入力信号の現在のフレームに対して、
    − 前記現在のフレームの各サンプルに対するスカラ量子化インデックス(IB(n))を送出するコア符号化段階(800、1500、1600)と、
    − エンハンスメント信号の各符号化サンプルに対するスカラ量子化
    のインデックス(Jk(n))を送出する、少なくとも1つのエンハンスメント符号化段階(EA-k)とを備え、
    前記エンハンスメント符号化段階が、目標信号を決定するために使用される符号化ノイズをシェーピングするためのフィルタ(W(z))を得るためのモジュール(850)、および、スカラ量子化の可能な値の組と、前記目標信号との間の誤差を最小化することにより、前記エンハンスメント信号のスカラ量子化
    のインデックス(Jk(n))を送出する量子化モジュール(EAk-3、EAk-4)を備えることを特徴とする階層コーダ。
  15. コード命令を含むコンピュータプログラムであって、これらの命令がプロセッサにより実行される場合に、請求項1から13のいずれか一項に記載の符号化方法のステップを実施することを特徴とするコンピュータプログラム。
JP2011543801A 2008-11-18 2009-11-17 スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 Active JP5474088B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0857839 2008-11-18
FR0857839A FR2938688A1 (fr) 2008-11-18 2008-11-18 Codage avec mise en forme du bruit dans un codeur hierarchique
PCT/FR2009/052194 WO2010058117A1 (fr) 2008-11-18 2009-11-17 Codage de signal audionumerique avec mise en forme du bruit dans un codeur hierarchique

Publications (2)

Publication Number Publication Date
JP2012509515A true JP2012509515A (ja) 2012-04-19
JP5474088B2 JP5474088B2 (ja) 2014-04-16

Family

ID=40661226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011543801A Active JP5474088B2 (ja) 2008-11-18 2009-11-17 スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化

Country Status (7)

Country Link
US (1) US8965773B2 (ja)
EP (1) EP2366177B1 (ja)
JP (1) JP5474088B2 (ja)
KR (1) KR101339857B1 (ja)
CN (1) CN102282611B (ja)
FR (1) FR2938688A1 (ja)
WO (1) WO2010058117A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014501395A (ja) * 2010-12-16 2014-01-20 オランジュ 階層型符号器における改良ステージの改良符号化
JP2014130213A (ja) * 2012-12-28 2014-07-10 Jvc Kenwood Corp 付加情報挿入装置、付加情報挿入方法、付加情報抽出装置、及び付加情報抽出方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
FR2972875A1 (fr) * 2011-03-17 2012-09-21 France Telecom Procede et dispositif de filtrage lors d'un changement de filtre arma
EP2951825B1 (en) 2013-01-29 2021-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands
US9667959B2 (en) 2013-03-29 2017-05-30 Qualcomm Incorporated RTP payload format designs
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9502044B2 (en) 2013-05-29 2016-11-22 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
EP4002359A1 (en) * 2014-06-10 2022-05-25 MQA Limited Digital encapsulation of audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
CN109416913B (zh) * 2016-05-10 2024-03-15 易默森服务有限责任公司 自适应音频编解码系统、方法、装置及介质
US10756755B2 (en) 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10699725B2 (en) 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10770088B2 (en) 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US11281312B2 (en) 2018-01-08 2022-03-22 Immersion Networks, Inc. Methods and apparatuses for producing smooth representations of input motion in time and space
US10763885B2 (en) * 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
KR102491948B1 (ko) * 2021-06-04 2023-01-27 한국 천문 연구원 단일 gnss 수신기를 이용한 고위도 전리권 플라즈마 불균질 수평방향 속력 결정 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179592A (ja) * 1995-12-21 1997-07-11 Kokusai Electric Co Ltd 可変レート音声符号化方式とその装置
US20070208557A1 (en) * 2006-03-03 2007-09-06 Microsoft Corporation Perceptual, scalable audio compression
JP2009527017A (ja) * 2006-02-14 2009-07-23 フランス テレコム オーディオ符号化/復号化で知覚的に重み付けするための装置

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3688097A (en) * 1970-05-20 1972-08-29 Bell Telephone Labor Inc Digital attenuator for non-linear pulse code modulation signals
US4386237A (en) * 1980-12-22 1983-05-31 Intelsat NIC Processor using variable precision block quantization
DE3411962A1 (de) * 1983-03-31 1984-10-31 Sansui Electric Co., Ltd., Tokio/Tokyo Datenuebertragungseinrichtung
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
FR2742568B1 (fr) 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6931058B1 (en) * 2000-05-19 2005-08-16 Scientific-Atlanta, Inc. Method and apparatus for the compression and/or transport and/or decompression of a digital signal
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
AU2094201A (en) * 1999-12-13 2001-06-18 Broadcom Corporation Voice gateway with downstream voice synchronization
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
EP1339041B1 (en) * 2000-11-30 2009-07-01 Panasonic Corporation Audio decoder and audio decoding method
US6614370B2 (en) * 2001-01-26 2003-09-02 Oded Gottesman Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding
SE521600C2 (sv) * 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7408918B1 (en) * 2002-10-07 2008-08-05 Cisco Technology, Inc. Methods and apparatus for lossless compression of delay sensitive signals
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
DE602004013031T2 (de) * 2003-10-10 2009-05-14 Agency For Science, Technology And Research Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
WO2006018748A1 (en) * 2004-08-17 2006-02-23 Koninklijke Philips Electronics N.V. Scalable audio coding
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
JP4887279B2 (ja) * 2005-02-01 2012-02-29 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100707184B1 (ko) * 2005-03-10 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
US7490036B2 (en) * 2005-10-20 2009-02-10 Motorola, Inc. Adaptive equalizer for a coded speech signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8781842B2 (en) * 2006-03-07 2014-07-15 Telefonaktiebolaget Lm Ericsson (Publ) Scalable coding with non-casual predictive information in an enhancement layer
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
KR101542069B1 (ko) * 2006-05-25 2015-08-06 삼성전자주식회사 고정 코드북 검색 방법 및 장치와 그를 이용한 음성 신호의부호화/복호화 방법 및 장치
US7933770B2 (en) * 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
DE602007012116D1 (de) * 2006-08-15 2011-03-03 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
JP2008170488A (ja) * 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US8199835B2 (en) * 2007-05-30 2012-06-12 International Business Machines Corporation Systems and methods for adaptive signal sampling and sample quantization for resource-constrained stream processing
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US8719012B2 (en) * 2007-06-15 2014-05-06 Orange Methods and apparatus for coding digital audio signals using a filtered quantizing noise
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009010674A1 (fr) * 2007-07-06 2009-01-22 France Telecom Codage hierarchique de signaux audionumeriques
KR100912826B1 (ko) * 2007-08-16 2009-08-18 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법
US8271273B2 (en) * 2007-10-04 2012-09-18 Huawei Technologies Co., Ltd. Adaptive approach to improve G.711 perceptual quality
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
GB2465047B (en) * 2009-09-03 2010-09-22 Peter Graham Craven Prediction of signals
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
US9263049B2 (en) * 2010-10-25 2016-02-16 Polycom, Inc. Artifact reduction in packet loss concealment
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179592A (ja) * 1995-12-21 1997-07-11 Kokusai Electric Co Ltd 可変レート音声符号化方式とその装置
JP2009527017A (ja) * 2006-02-14 2009-07-23 フランス テレコム オーディオ符号化/復号化で知覚的に重み付けするための装置
US20070208557A1 (en) * 2006-03-03 2007-09-06 Microsoft Corporation Perceptual, scalable audio compression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014501395A (ja) * 2010-12-16 2014-01-20 オランジュ 階層型符号器における改良ステージの改良符号化
JP2014130213A (ja) * 2012-12-28 2014-07-10 Jvc Kenwood Corp 付加情報挿入装置、付加情報挿入方法、付加情報抽出装置、及び付加情報抽出方法

Also Published As

Publication number Publication date
EP2366177A1 (fr) 2011-09-21
US20110224995A1 (en) 2011-09-15
KR101339857B1 (ko) 2013-12-10
KR20110095387A (ko) 2011-08-24
EP2366177B1 (fr) 2015-10-21
FR2938688A1 (fr) 2010-05-21
CN102282611B (zh) 2013-05-08
WO2010058117A1 (fr) 2010-05-27
JP5474088B2 (ja) 2014-04-16
US8965773B2 (en) 2015-02-24
CN102282611A (zh) 2011-12-14

Similar Documents

Publication Publication Date Title
JP5474088B2 (ja) スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化
RU2696292C2 (ru) Аудиокодер и декодер
CN1957398B (zh) 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
CA2778240C (en) Multi-mode audio codec and celp coding adapted therefore
JP6779966B2 (ja) 先進量子化器
KR20090104846A (ko) 디지털 오디오 신호에 대한 향상된 코딩/디코딩
CA2578610A1 (en) Voice encoding device, voice decoding device, and methods therefor
JP2006510947A (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
WO2008072670A1 (ja) 符号化装置、復号装置、およびこれらの方法
KR101698371B1 (ko) 디지털 오디오 신호들의 개선된 코딩/디코딩
KR20080093450A (ko) 오디오 인코딩/디코딩에서의 인지 가중 장치
WO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
CN101131820A (zh) 编码设备、解码设备、编码方法和解码方法
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
US20130268268A1 (en) Encoding of an improvement stage in a hierarchical encoder
JP5539992B2 (ja) レート制御装置、レート制御方法及びレート制御プログラム
JP5451603B2 (ja) デジタルオーディオ信号の符号化

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140204

R150 Certificate of patent or registration of utility model

Ref document number: 5474088

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250