JP5117407B2 - オーディオ符号化/復号化で知覚的に重み付けするための装置 - Google Patents

オーディオ符号化/復号化で知覚的に重み付けするための装置 Download PDF

Info

Publication number
JP5117407B2
JP5117407B2 JP2008554819A JP2008554819A JP5117407B2 JP 5117407 B2 JP5117407 B2 JP 5117407B2 JP 2008554819 A JP2008554819 A JP 2008554819A JP 2008554819 A JP2008554819 A JP 2008554819A JP 5117407 B2 JP5117407 B2 JP 5117407B2
Authority
JP
Japan
Prior art keywords
perceptual weighting
gain compensation
filter
signal
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008554819A
Other languages
English (en)
Other versions
JP2009527017A (ja
Inventor
ステファン・ラゴ
ロマン・トリリング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2009527017A publication Critical patent/JP2009527017A/ja
Application granted granted Critical
Publication of JP5117407B2 publication Critical patent/JP5117407B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、所定の周波数バンドでオーディオ信号を符号化/復号化するための知覚重み付け装置に関する。また、本発明は、本発明の符号化/復号化装置を含む階層オーディオ符号化装置及び階層オーディオ復号化装置に関する。
本発明は、オーディオ周波数の発話、音楽等の信号を、デジタル信号として伝送及び記憶することに対する特に有利な用途に向けられる。
オーディオ周波数の発話、音楽等の信号をデジタル化及び圧縮するための各種技術がある。最も一般的な方法は
・PCM及びADPCM符号化等の“波形符号化”方法
・符号励振線形予測(CELP)符号化等の“パラメータ解析/合成符号化”方法
・“サブバンド又は変換知覚符号化”方法
オーディオ周波数信号を符号化するためのこれら従来技術は、W.B. Kleijn及びK.K. Paliwalによる1995年 Elsevier “Speech coding and Synthesis”に記載されている。
これに関連して、本発明は、CELP符号化及び変換符号化技術を組込む予測変換符号化方法に特に向けられる。
従来の発話に対する符号化では、符号化装置は、固定ビットレートでビットストリームを生成する。この固定ビットレートによる制約は、“コーデック”と組み合わせて一般に称される符号化器及び復号化器の実装及び使用を単純にしている。そのようなシステムの例は、毎秒64キロビット(kbps)のITU-T G.711符号化システム、8kbpsのUIT-T G.729符号化システム、及び12.2kbpsのGSM-EFR符号化システムである。
しかし、携帯電話、ボイスオーバIP及びアドホックネットワーク通信等のいくつかの用途では、予め設定される可変ビットレートでビットストリームを生成するのが好ましい。従って、固定ビットレートより柔軟性のある多数のビットレート符号化技術は、以下の点で優れている。
・AMR-NB、AMR-WB、SMV及びVMR-WBシステムで用いるソース及び/又はチャンネル制御マルチモード符号化
・コアビットレートと一つ以上のエンハンスメントレイヤとを含むという意味で階層的なビットレートを生成する“スケーラブル”符号化としても知られる階層符号化
48kbps、56kbps及び64kbpsのG.722システムは、ビットレートスケーラブル符号化の簡単な一例である。MPEG-4CELPコーデックは、ビットレート及びバンド幅がスケーラブルであり、そのようなコーデックの他の例は、B. Kovesi、D. Massaloux、A. Sollaudによる2004年 ICASSPでの文献“A Scalable Speech and Audio Coding Scheme with Continuous Bitrate Flexibility”に記載されている。
・多重記述符号化
本発明は、特に階層符号化に関する。
階層即ち“スケーラブル”オーディオ符号化の基本概念は、例えばY.Hiwasaki、T.Mori、H.Ohmuro、J.Ikedo、D.Tokumono及びA.Kataokaらによる2004年3月、NTT Technical Review “Scalable Speech Coding Technology for High-Quality Ubiquitous Communications”で説明されている。
このタイプの符号化において、ビットストリームは、ベースレイヤ又はコアレイヤと一つ以上のエンハンスメントレイヤとを含む。ベースレイヤは、低い固定ビットレートでコア“コーデック”として知られるコーデックによって生成され、最小レベルの符号化品質をほぼ保証し、復号化装置によって受信される必要があり、従って好ましい品質レベルを維持することができる。
エンハンスメントレイヤは、品質を高めるのに使用され、復号化装置によって全て受信されないことがある。階層符号化の主な利点は、ビットレートがビットストリームを単に切断することによって調節できる点である。レイヤの許容数、即ちビットストリームの許容切断数は、符号化の粒度(coding granularity)を定める。符号化の粒度が強い場合、ビットストリームは、少数のレイヤ(2〜4レイヤのオーダ)を含む一方、細かい符号化の粒度は、例えば1kbpsのオーダの増分を提供する。
本発明は特に、電話バンドにおけるCELPタイプのコア符号化装置と一つ以上のワイドバンドエンハンスメントレイヤとを用いた、ビットレート及びバンド幅スケーラブル符号化技術に関する。そのようなシステムの例は、8kbps、14.2kbps及び24kbpsの粗い粒度を備える、1999年 107th Convention AESでのH. Taddeiらによる文献“A Scalable Three Bitrate (8、14.2及び24kbps) Audio Coder”で与えられ、B. Kovesiらによる前述の文献は、6.4kbps〜32kbpsの細かい粒度に言及している。
2004年、ITU-Tは、階層コア符号化装置標準化計画を立ち上げた。このG.729EV符号化装置(EVは“埋め込み可変ビットレート”を表す)は、周知のG.729符号化装置の増設である。G.729EV標準の目的は、会話サービス用に8kbps〜32kbpsのビットレートで狭いバンド(300hertz(Hz)〜3400Hz)から広いバンド(50Hz〜7000Hz)に及ぶバンドを備える信号を生成するG.729コア階層符号化装置を得ることにある。この符号化装置は、G.729レコメンデーションと相互作用することが基本的に可能であり、既存のボイスオーバIP機器に対する互換性を保証する。
図1に示す8kbps〜32kbpsの階層オーディオ符号化装置は、上記計画に応えるために提案され、2005年7月26日〜8月5日、GenevaのStudy Period 2005-2008、Q.10/16でのITU-Tによる文献“France Telecom G.729EV Candidate; High level description and complexity evaluation”のCOM 16、D135(WP 3/16)に記載されている。この符号化装置は、カスケードCELP符号化とフルバンド線形予測符号化(LPC)によるバンド拡張と予測変換符号化とを備えた3レイヤ符号化を行う。TDAC(時間領域エイリアシング相殺)符号化は、変形離散コサイン変換(MDCT)の下記用途に適用される。予測変換符号化レイヤは、フルバンド知覚重み付けフィルタ
Figure 0005117407
を用いる。
知覚重み付けフィルタリングによって符号化ノイズを形成する概念は、前述のW.B. Kleijnらによる文献で説明される。現に、知覚重み付けフィルタリングは、ノイズ強度が高くかつノイズがより簡単にマスクできる周波数で信号を減衰することにより、符号化ノイズを形成する。
狭いバンドのCELP符号化で最も広く使用される知覚重み付けフィルタは形式が
Figure 0005117407
であり、ここで0≦γ≦γ<1であり
Figure 0005117407
は、5ミリ秒(ms)〜30msの長さである信号セグメントのLPCスペクトルを示す。従って、CELP符号化の合成による分析は、このタイプのフィルタによって知覚的に重み付けされた信号領域における2次エラーを最小化することになる。
しかし、G.729EV標準化に関連して提案されたこの技術は、フルバンド永久重み付けフィルタを用いるという欠点を有する。関連フィルタリングは、計算時間について比較的複雑である。
従って、本発明の要旨によって解決される技術的課題は、リソースの観点からコストのかかる長い計算をもたらすことなく、フルバンド知覚重み付けフィルタリングを提供する所定の周波数バンドで、即ち前記所定の周波数バンドの全体にわたって、特にワイドバンドである0から8000Hzの階層オーディオ符号化装置で、オーディオ信号を符号化/復号化するための知覚重み付け装置を提供することである。
上記技術的課題に対する本発明の解決策とは、前記符号化/復号化は、前記所定の周波数バンドにおける複数の隣接サブバンドで実行され、前記装置は、利得補償を備える知覚重み付けフィルタの出力信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを、少なくとも一つのサブバンドで含むことである。
故に、本発明の知覚重み付け装置は、符号化/復号化バンドの全体にわたってではなく、一つ以上のサブバンドにわたって必要なフィルタリングを行い、計算の複雑性を抑える。また、知覚重み付けフィルタリングの利得間における一方のサブバンドから他方のサブバンドへの任意の離間は、利得補償によって除去され、全周波数バンドにわたるスペクトルの連続性を保証する。従って、本発明は、知覚重み付けフィルタリングの後に均一なバンドを生成し、たとえそれを構成するサブバンドが、別に処理された観点からであっても、生成する。
これに関する特に重要な利点は、フルバンド変換符号化がサブバンドにわたって適用できることであって、サブバンドは、別々にフィルタ処理されるので均一でない場合がある。
もちろん、各サブバンドは、知覚重み付けでフィルタ処理できるか、又はできない。故に、スペクトルの連続性は、フィルタ処理された一方のサブバンドとフィルタ処理されない他方のサブバンドとの間、又はフィルタ処理された2つのサブバンド間に提供されうる。
一つの実施形態において、利得補償を備える前記知覚重み付けフィルタは、知覚重み付けフィルタ及び利得補償モジュールを含む。
特定の実施形態において、利得補償モジュールは、前記知覚重み付けフィルタの出力に配置される。
もう一つの特定の実施形態において、利得補償モジュールは、前記知覚重み付けフィルタの入力に配置される。
もう一つの実施形態において、利得補償を備える前記知覚重み付けフィルタは、利得補償を組込む知覚重み付けフィルタを含む。
第1サブバンドの前記知覚重み付けフィルタは、形式が
Figure 0005117407
でもよく、ここで
Figure 0005117407
は、線形予測フィルタを示す。この状況において、本発明は、前記利得補償が以下に定義する関数facによって多重化を行うことを教示し、ここで
Figure 0005117407
は、線形予測フィルタ
Figure 0005117407
の係数である。
Figure 0005117407
オーダが、係数が
Figure 0005117407
の線形予測フィルタ
Figure 0005117407
は、以下のように定義される。
Figure 0005117407
また、本発明は、隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ符号化装置に関し、前記符号化装置は
・前記周波数バンドの第1サブバンドで原信号を符号化するためのコア符号化装置と
・前記原信号と前記コア符号化装置からの信号とから残余信号を計算するための段階と
・前記残余信号を知覚的に重み付けするための装置とを含み、
特に、前記知覚重み付け装置は、利得補償を備える前記知覚重み付けフィルタの出力信号と第2サブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを含む。
この実施形態において、第1サブバンドのみ、知覚重み付けフィルタリングを受け、第2サブバンドは、フィルタ処理されない。
また、前記利得補償された知覚重み付けフィルタが第1サブバンドの知覚重み付けフィルタを含む場合、本発明は、第1サブバンドの前記知覚重み付けフィルタが形式
Figure 0005117407
であることを教示し、ここで
Figure 0005117407
は、線形予測フィルタを示す。この状況では、第1サブバンドの利得補償は、以下の関数fac1によって多重化を行う。
Figure 0005117407
ここで、
Figure 0005117407
は、線形予測フィルタ
Figure 0005117407
の係数である。
有利な点として、第1サブバンドの知覚重み付け装置からの信号と第2サブバンドの原信号とは、各変換分析モジュールに適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置に接続される。
本発明の階層オーディオ符号化装置の変形として、前記符号化装置はまた、第2サブバンドの原信号を知覚的に重み付けするための知覚重み付け装置を含み、利得補償を備える知覚重み付けフィルタの出力信号と第1サブバンドの知覚重み付け装置の出力信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを含む。
故に、これは、知覚重み付けフィルタリングが2つのサブバンドにおいて別に行われる符号化装置である。
利得補償を備える前記知覚重み付けフィルタが第2バンドの知覚重み付けフィルタを含む場合、第2サブバンドの前記知覚重み付けフィルタは、形式が
Figure 0005117407
であり、ここで
Figure 0005117407
は、線形予測フィルタを示す。この例において、第2サブバンドの前記利得補償は、以下の関数fac2によって多重化を行う。
Figure 0005117407
ここで
Figure 0005117407
は、前記線形予測フィルタの係数である。
有利な点として、前記線形予測フィルタの係数は、バンド拡張モジュールによって供給される。
第1サブバンドの知覚重み付け装置からの信号と第2サブバンドの知覚重み付け装置からの信号とは、各変換分析モジュールに有利に適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置に接続される。
特定の実施形態において、コア符号化装置は、線形予測ベースの符号化装置、例えばCELP符号化装置である。
また、本発明は、隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ復号化装置に関し、前記復号化装置は
・本発明の符号化装置によって符号化された受信信号を前記周波数バンドの第1サブバンドで復号化するよう適合されたコア復号化装置と
・前記符号化装置の知覚重み付け装置によって第1サブバンドで重み付けされた残余信号を示す信号を逆知覚重み付けするための逆知覚重み付け装置とを具備し、
前記逆知覚重み付け装置は、第1サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタの逆数である利得補償を備える知覚重み付けフィルタを含む。
代わりに、本発明では、前記復号化装置は、第2サブバンドの復号化信号に対する逆近く重み付け装置も含み、第2サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタの逆数である利得補償を備える知覚重み付けフィルタを含むことを教示する。
この後者の状況において、利得補償を備える前記知覚重み付けフィルタが第2サブバンドの知覚重み付けフィルタを含む場合、利得補償を備える前記逆知覚重み付けフィルタは、第2サブバンドの逆知覚重み付けフィルタを含む。特に、第2サブバンドの前記逆知覚重み付けフィルタは、形式が
Figure 0005117407
であり、ここで、線形予測フィルタ
Figure 0005117407
の係数は、バンド拡張モジュールによって供給される。
また、本発明は、所定の周波数バンドでオーディオ信号を符号化する知覚重み付け方法に関し、特に前記符号化は、前記周波数バンドである複数の隣接サブバンドで行われ、前記方法は、利得補償を備える前記知覚重み付け段階からの信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償で知覚重み付けする段階を、少なくとも1つのサブバンドで含む。
最後に、本発明は、前記信号を符号化するのに用いる知覚重み付け方法により所定の周波数バンドで符号化されたオーディオ信号を復号化するための知覚重み付け方法に関し、特に前記方法は、利得補償を備える前記知覚重み付け段階の逆数である利得補償を備える知覚重み付け段階を、前記サブバンドで含む。
図2は、8kbpsから32kbpsまでのビットレートに対するサブバンド階層オーディオ符号化装置を示す。この図は、その符号化方法における各段階を示す。
50Hzから7000Hzまでの“ワイド”周波数バンドで、かつ16kHzでサンプル化された入力信号は先ず、直交ミラーフィルタ(QMF)によって2つの隣接サブバンドに分割される。ローバンドとしても知られる0から4000Hzまでの第1サブバンドは、低域通過(L)フィルタリング300とデシメーション301とによって得られ、ハイバンドとしても知られる4000から8000Hzまでの第2サブバンドは、高域通過(H)フィルタリング302とデシメーション303とによって得られる。好ましい実施形態では、Lフィルタ300及びHフィルタ302は、長さが64であり、1980年 ICASSP vol. 5 pp. 291-294 J. Johnstonによる文献“A filter family designed for use in quadrature mirror filter banks”で説明されている。
第1サブバンドは、ナローバンドCELPコア符号化装置305による符号化前に、50Hzを下回る成分を除去する高域通過フィルタ304によって前処理される。高域通過フィルタリングは、ワイドバンドが50Hzから7000Hzまでの範囲に及ぶものとして定義される事実を考慮に入れる。この実施形態では、ナローバンドCELP符号化は、図1に示す符号化に相当し、前処理フィルタのない変形されたG.729符号化(“共役構造代数符号励振線形予測(CS-ACELP)を用いて発話を8kbpsで符号化する”1996年3月 ITU-T推奨のG. 729)を第1段階で用いるカスケードCELP符号化と、追加の固定ディクショナリからなる第2段階とで構成される。CELP符号化で発生するエラーに関係する残余信号eは、段階306で計算され、その後知覚重み付けフィルタを含む装置307によって知覚的に重み付けされ、時間領域信号x10を得て、その信号は、変形離散コサイン変換(MDCT)308を用いて分析され、周波数領域の離散スペクトルX10を得る。
図3は、知覚重み付け装置307を示し、W1(z)は、それぞれフィルタリング段階501及び502である
Figure 0005117407
Figure 0005117407
とを含む、知覚重み付けフィルタ
Figure 0005117407
を含む。図2に示す通り、線形予測フィルタ
Figure 0005117407
は、ナローバンドCELP符号化に基づく。知覚重み付け装置307は、利得補償モジュール503も含み、フィルタ501、502から来る知覚重み付け信号を、以下に定義する関数fac1によって多重化する。
Figure 0005117407
ここで、
Figure 0005117407
は、フィルタ
Figure 0005117407
の係数であり、フィルタは以下のように表される。
Figure 0005117407
好ましい実施形態では、係数
Figure 0005117407
は、5msサブフレーム毎に更新されγ1=0.96及びγ2=0.6である。
関数fac1に等しい定義は、ナイキスト周波数(4kHz)におけるフィルタ
Figure 0005117407
の利得の逆数に相当し、即ちz=−1で以下のようになる。
Figure 0005117407
第2のサブバンド、即ちハイバンドのスペクトルエイリアシング除去装置309は、先ず高域通過フィルタリング302がデシメーション303と組み合わせて生ずるエイリアシングを補償する。その後、このハイバンドは、7000と8000Hzとの間にある原信号の成分を除去する低域通過フィルタ310によって前処理される。MDCT変換装置311は、時間領域の結果信号xhiに適用され、周波数領域の離散スペクトルXhiを得る。その後、バンド拡張装置312は、xhi及びXhiに基づく。
信号x10及びxhiは、N個のサンプルからなるフレームに分割され、長さL=2のMDCT変換装置は、現在及び将来のフレームを分析する。好ましい実施形態では、x10及びxhiは、8kHz及びN=160(20ms)でサンプル化されたナローバンド信号である。MDCTは、x10及びxhiを変換するので、N=160個の係数を含み、各係数は、4000/160=25Hzの周波数バンドを示す。好ましい実施形態では、MDCT変換装置は、1991年 ICASSP vol. 3 pp. 2209-2212 P. Duhamel、Y. Mahieux、J. P. Petitにより記述されたアルゴリズム“A fast algorithm for the implementation of filter banks based on time domain aliasing cancellation”で実行される。
ローバンド及びハイバンドMDCTスペクトルX10及びXhiは、変換符号化モジュール313で符号化される。
符号化モジュール305、312及び313が生成したビットストリームは、多重化され、マルチプレクサ314で階層ビットストリームへと構築される。
符号化は、20msフレーム(即ち320個のサンプルからなるブロック)で行われる。符号化ビットレートは、8kbps、12kbps、14kbpsから32kbpsである。
関数fac1による利得補償を用いた知覚重み付け段階の利点は、図4を参照して以下に説明される。
その図は、全周波数バンドを第1サブバンド、即ち0から4kHzまでのローバンドと、第2サブバンド、即ち4から8kHzまでのハイバンドとに分割することを示す。好ましい実施形態では、MDCT符号化装置313は
・ローバンドのMDCT変換装置に適用する前の知覚重み付けフィルタリングW1(z)及び利得補償
・知覚重み付けフィルタリングがないハイバンドの直接MDCT変換
が行われた、これら2つのサブバンドに適用される。
サブバンドにおけるこれら2つの動作は、ローバンドで
Figure 0005117407
の振幅応答と、ハイバンドで0dBの平坦応答とによって図4において図式的に示される。後者の平坦応答は、MDCT変換を適用する前にハイバンドで適用される処理がないことを示す。関数fac1による利得補償は
Figure 0005117407
の振幅応答を、4kHzでの連続性を確実にするためにシフトする。この連続性は、2つの離散スペクトルX10及びXhiを単一ベクトルXへ、後で結合的かつ均一的に符号化できる点でとても重要であり、そのベクトルは、フルバンド離散スペクトルを示す。
ローバンドとハイバンドとの間の連続性を定める、ここで用いた値0dBは、単なる例示に過ぎない点に留意すべきである。
図2、3及び4を参照して説明した符号化装置に関する階層オーディオ復号化装置は、図5に示され、前記符号化装置によって符号化された信号を復号化する段階を示す。
各20msフレームを定義するビットは、デマルチプレクサ700で逆多重化される。実際にビットストリームが8kbps、12kbps、14kbps、又は14kbpsと32kbpsとの間で切断されてもよいが、8kbpsから32kbpsへ復号化する過程は、以下に説明される。
8kbps及び12kbpsのレイヤのビットストリームは、CELP復号化装置701によって使用され、0から4000Hzまでの第1サブバンド(ナローバンド)で第1の合成を生成する。14kbpsのレイヤに関するビットストリーム部分は、バンド拡張モジュール702によって復号化され、MDCT変換装置703は、4000Hzから7000Hzまでの第2サブバンド(ハイバンド)で得られた信号に適用され、スペクトル
Figure 0005117407
を生む。MDCT復号化装置704は、14kbpsから32kbpsまでのビットレートに関するビットストリームから、ローバンドの再構築スペクトル
Figure 0005117407
と、ハイバンドの再構築スペクトル
Figure 0005117407
とを生成する。これら2つのスペクトルは、ブロック705及び706で逆MDCT変換を適用することによって、時間領域信号
Figure 0005117407
Figure 0005117407
とに変換される。信号
Figure 0005117407
は、逆知覚重み付け装置707によってフィルタリングした後に加算器708によってCELP合成に追加される。その後、結果値は、709で後続的にフィルタ処理される。
16kHzでサンプル化されたワイドバンドの出力信号は、オーバーサンプリング(710及び712)、低域通過フィルタリング(711)、高域通過フィルタリング(713)及び合計(714)を適用する、合成QMFフィルタバンクを用いて得られる。
利得補償を用いた知覚復号化の段階は、逆知覚重み付け装置707 W1(z)-1によって行われ、その装置は、逆知覚重み付けフィルタ
Figure 0005117407
と、利得補償モジュールとを含み、関数1/fac1によって前記逆知覚重み付けフィルタから信号を多重化し、その関数は以下のように現される。
Figure 0005117407
ここで、
Figure 0005117407
は、ナローバンドのCELP符号化から生ずるフィルタ
Figure 0005117407
の係数である。符号化装置と同様に、係数
Figure 0005117407
は、各5msのサブフレームで一定に維持される。
図6は、符号化装置に対する図2の実施形態の変形を示す。
この図は、分析フィルタバンク900から903、ローバンドの処理であるブロック904から908、ハイバンドの前処理であるブロック909から910、MDCT符号化装置913及びマルチプレクサ915を示す。
この変形実施形態と図2の実施形態との間の主な違いは、線形予測(LPC)分析と第2サブバンド(ハイバンド)の量子化との導入である。ハイバンドで量子化されたLPC係数
Figure 0005117407
は、バンド拡張モジュール911によって供給される。LPCベースのバンド拡張は、本発明の範囲外なのでここで詳細に説明しない。これらLPC係数によって、MDCT変換913の前に装置912による利得補償W2(z)を用いた知覚重み付けフィルタリングを可能にする。従って、この変形実施形態は、ローバンドの差分信号eとハイバンドの信号xhiとの知覚重み付けを意味する一方、上記の実施形態は、ローバンドの作動信号eのみを予め知覚的に重み付けしている。
この変形実施形態では、ハイバンドの利得補償W2(z)を用いた知覚重み付け装置912は、ローバンドのフィルタW1(z)と同じ形式をとる。従って、利得補償関数fac2は、
Figure 0005117407
というタイプのフィルタに対して後続的であり、以下のように定義される。
Figure 0005117407
ここで、
Figure 0005117407
は、フィルタ
Figure 0005117407
の係数であり、そのフィルタは、以下のように表せる。
Figure 0005117407
ここで、γ´1=0.96 γ´2=0.6
この関数は、z=1、即ち周波数が0Hzであるか、又は実際4kHzに相当するハイバンドのDC成分の周波数がQMFフィルタリング前の入力信号の周波数に戻るとき
Figure 0005117407
に相当する。
2つのサブバンドに利得補償を用いた知覚重み付けの利点は、図8を参照して以下に説明され、ローバンド(0から4kHz)とハイバンド(4kHzから8kHz)とに分割されることを示す。ここで、変形実施形態を考慮すると、MDCT符号化装置は
・ローバンドのMDCT前にフィルタリングW1(z)し
・ハイバンドのMDCT前にフィルタリングW2(z)した
これら2つのサブバンドに適用される。
これら2つのサブバンド動作はそれぞれ、ローバンドの
Figure 0005117407
の振幅応答と、ハイバンドの
Figure 0005117407
の振幅応答とによって示される。
各関数fac1及びfac2によるロー及びハイバンドの利得補償は、4kHzにおけるフィルタの応答の連続性を保証する。この連続性により、2つの離散スペクトルX10及びXhiは、単一ベクトルで後続的に符号化されうる。また、ロー及びハイバンド間の連続性を定める、ここで使用される値0dBは、単なる例示である点に留意すべきである。
この変形実施形態に相当する階層オーディオ復号化装置は、図7に示される。上記の実施形態の復号化装置と比較して異なる点は、バンド拡張モジュール1002が用いる量子化LPC係数
Figure 0005117407
の回復、及び信号
Figure 0005117407
への逆知覚重み付けフィルタ
Figure 0005117407
の適用だけである。ハイバンドで用いる逆フィルタリング
Figure 0005117407
は、関数1/fac2による利得補償が後に続く
Figure 0005117407
のタイプであり、ここでfac2は、上記定義した通りである。
本発明は、コンピュータ又は専用装置によって実行する媒体に記憶された一連の命令を含むコンピュータプログラムに及び、特にそれら命令の実行によって、符号化及び/又は復号化する本発明の知覚重み付け方法を実行する。
上記コンピュータプログラムは、例えば本発明の知覚重み付け装置にインストールされた、直接実行可能なプログラムである。
勿論、本発明は、上記説明した実施形態に限定されない。特に
・パラメータγ1、γ2、γ´1及びγ´2の数値は、上記選択値と異なってもよく;
・補償関数は、
Figure 0005117407
フィルタリングの前、又は
Figure 0005117407
Figure 0005117407
フィルタリングとの間に適用されるか、又は
Figure 0005117407
若しくは
Figure 0005117407
フィルタリングに組込まれてもよく;同じことが関数fac2及び対応逆フィルタについて言え
・知覚重み付けフィルタは、形式が
Figure 0005117407
である必要はなく;
・2つより多いサブバンドは、全周波数バンドで定義されてもよい;点に留意すべきである。
図1は、変換符号化の前におけるフルバンド知覚重み付けフィルタリングを実行する、従来の階層オーディオ符号化装置の図である。 図2は、本発明の階層オーディオ符号化装置のハイレベル図である。 図3は、図2の符号化装置の知覚重み付け装置に関する図である。 図4は、本発明に従い、第1のサブバンドでフィルタ処理されて利得補償された信号の振幅と、第2のサブバンドでフィルタ処理されない信号の振幅とを表すスペクトルを示す。 図5は、本発明の階層オーディオ復号化装置のハイレベル図である。 図6は、図2の階層オーディオ符号化装置の変形図である。 図7は、図5の階層オーディオ復号化装置の変形図である。 図8は、本発明に従い、第1のサブバンドでフィルタ処理されて利得補償された信号の振幅と、本発明に従い、第2のサブバンドでフィルタ処理されて均一にされた信号の振幅とを表すスペクトルを示す。
符号の説明
301 高域通過
310 低域通過
313 14〜32kbit/s MDCT符号化装置

Claims (10)

  1. 所定の周波数バンドでオーディオ信号を符号化/復号化するための知覚重み付け装置であって、
    前記符号化/復号化は、前記所定の周波数バンドにおける複数の隣接サブバンドで実行され、
    前記装置は、利得補償を備える知覚重み付けフィルタ(307)を、少なくとも一つのサブバンドで含み、
    利得補償を備える前記知覚重み付けフィルタは、形式が
    Figure 0005117407
    であり、ここで
    Figure 0005117407
    は、線形予測フィルタを示し、0≦γ ≦1及び0≦γ ≦1であり、ここでfacは、前記線形予測フィルタ
    Figure 0005117407
    の係数の関数である利得補償関数を示し、前記利得補償は、利得補償を備える前記知覚重み付けフィルタの出力信号と前記少なくとも一つのサブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合され
    前記利得補償関数facは、
    Figure 0005117407
    によって与えられ、ここで
    Figure 0005117407
    は、前記線形予測フィルタ
    Figure 0005117407
    の係数であり、pは、前記線形予測フィルタ
    Figure 0005117407
    次数であることを特徴とする知覚重み付け装置。
  2. 利得補償を備える前記知覚重み付けフィルタ(307)は、知覚重み付けフィルタ(501、502)と利得補償モジュール(503)とを含むことを特徴とする請求項1に記載の装置。
  3. 利得補償を備える前記知覚重み付けフィルタは、利得補償を組込む知覚重み付けフィルタを含むことを特徴とする請求項1に記載の装置。
  4. 隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ符号化装置であって、前記符号化装置は、
    ・前記周波数バンドの第1サブバンドで原信号を符号化するためのコア符号化装置(305;905)と、
    ・前記原信号と前記コア符号化装置からの信号とから残余信号(e)を計算するための段階(306;906)と、
    ・前記残余信号(e)を知覚的に重み付けするための装置とを具備し、
    前記知覚重み付け装置は、形式が
    Figure 0005117407
    である利得補償を備える知覚重み付けフィルタ(307;907)を含み、ここで
    Figure 0005117407
    は、線形予測フィルタを示し、0≦γ ≦1及び0≦γ ≦1であり、ここでfac 1 は、前記線形予測フィルタ
    Figure 0005117407
    の係数の関数である利得補償関数を示し、前記利得補償は、利得補償を備える前記知覚重み付けフィルタの出力信号と第2サブバンドの信号との間でスペクトルの連続性を実現するよう適合され
    前記利得補償関数は、
    Figure 0005117407
    によって与えられ、ここで
    Figure 0005117407
    は、前記線形予測フィルタ
    Figure 0005117407
    の係数であり、pは、前記線形予測フィルタ
    Figure 0005117407
    の次数であることを特徴とする階層オーディオ符号化装置。
  5. 利得補償を備える前記知覚重み付けフィルタ(307)は、第1サブバンドの知覚重み付けフィルタ(501、502)を含むことを特徴とする請求項に記載の符号化装置。
  6. 前記線形予測フィルタの係数は、前記コア符号化装置(305)によって供給されることを特徴とする請求項に記載の符号化装置。
  7. 第1サブバンドの知覚重み付け装置(307)からの信号と第2サブバンドの原信号とは、各変換分析モジュール(308、311)に適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置(313)に接続されることを特徴とする請求項4〜6のうち何れか1項に記載の符号化装置。
  8. 隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ復号化装置であって、前記復号化装置は、
    ・請求項6または7に記載の符号化装置によって符号化された受信信号を前記周波数バンドの第1サブバンドで復号化するよう適合されたコア復号化装置(701;1001)と、
    ・前記符号化装置の知覚重み付け装置(307;907)によって第1サブバンドで重み付けされた残余信号(e)を示す信号を逆知覚重み付けするための逆知覚重み付け装置とを具備し、
    前記逆知覚重み付け装置(707;1008)は、第1サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタ(307)の逆数である利得補償を備える知覚重み付けフィルタを含み、
    前記逆知覚重み付け装置の利得補償を備える前記知覚重み付けフィルタは、形式が
    Figure 0005117407
    であり、ここで
    Figure 0005117407
    は、線形予測フィルタを示し、0≦γ ≦1及び0≦γ ≦1であり、ここで1/fac 1 は、前記線形予測フィルタ
    Figure 0005117407
    の係数の関数である利得補償関数を示し、
    Figure 0005117407
    によって与えられ、ここで
    Figure 0005117407
    は、前記線形予測フィルタ
    Figure 0005117407
    の係数であり、pは、前記線形予測フィルタ
    Figure 0005117407
    の次数であることを特徴とする階層オーディオ復号化装置。
  9. 所定の周波数バンドでオーディオ信号を符号化する知覚重み付け方法であって、
    前記符号化は、前記周波数バンドにおける複数の隣接サブバンドで実行され、
    前記方法は、利得補償を備える知覚重み付け段階を、少なくとも一つのサブバンドで含み、
    利得補償を備える前記知覚重み付けフィルタは、形式が
    Figure 0005117407
    であり、ここで
    Figure 0005117407
    は、線形予測フィルタを示し、0≦γ ≦1及び0≦γ ≦1であり、ここでfacは、前記線形予測フィルタ
    Figure 0005117407
    の係数の関数である利得補償関数を示し、前記利得補償は、利得補償を備える前記知覚重み付けフィルタ出力信号と前記少なくとも一つのサブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合され
    前記利得補償関数facは、
    Figure 0005117407
    によって与えられ、ここで
    Figure 0005117407
    は、前記線形予測フィルタ
    Figure 0005117407
    の係数であり、pは、前記線形予測フィルタ
    Figure 0005117407
    の次数であることを特徴とする知覚重み付け方法。
  10. コンピュータ又は専用装置によって実行する媒体上に記憶された一連の命令を含むコンピュータプログラムであって、
    前記命令の実行は、請求項に記載の知覚重み付け方法を実行することを特徴とするプログラム。
JP2008554819A 2006-02-14 2007-02-07 オーディオ符号化/復号化で知覚的に重み付けするための装置 Expired - Fee Related JP5117407B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0650538 2006-02-14
FR0650538 2006-02-14
PCT/FR2007/050760 WO2007093726A2 (fr) 2006-02-14 2007-02-07 Dispositif de ponderation perceptuelle en codage/decodage audio

Publications (2)

Publication Number Publication Date
JP2009527017A JP2009527017A (ja) 2009-07-23
JP5117407B2 true JP5117407B2 (ja) 2013-01-16

Family

ID=36952401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008554819A Expired - Fee Related JP5117407B2 (ja) 2006-02-14 2007-02-07 オーディオ符号化/復号化で知覚的に重み付けするための装置

Country Status (7)

Country Link
US (1) US8260620B2 (ja)
EP (1) EP1989706B1 (ja)
JP (1) JP5117407B2 (ja)
KR (1) KR101366124B1 (ja)
CN (1) CN101385079B (ja)
AT (1) ATE531037T1 (ja)
WO (1) WO2007093726A2 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
GB2448201A (en) * 2007-04-04 2008-10-08 Zarlink Semiconductor Inc Cancelling non-linear echo during full duplex communication in a hands free communication system.
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
ES2539304T3 (es) * 2008-07-11 2015-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Un aparato y un método para generar datos de salida por ampliación de ancho de banda
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
KR101170466B1 (ko) 2008-07-29 2012-08-03 한국전자통신연구원 Mdct 영역에서의 후처리 방법, 및 장치
ES2671711T3 (es) * 2008-09-18 2018-06-08 Electronics And Telecommunications Research Institute Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
EP2502229B1 (en) * 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN102223527B (zh) * 2010-04-13 2013-04-17 华为技术有限公司 频带加权量化编解码方法和装置
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
CN113206773B (zh) 2014-12-23 2024-01-12 杜比实验室特许公司 与语音质量估计相关的改进方法和设备
WO2017050398A1 (en) 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
WO2020146867A1 (en) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. High resolution audio coding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
FR2734389B1 (fr) * 1995-05-17 1997-07-18 Proust Stephane Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
EP1052622B1 (en) * 1999-05-11 2007-07-11 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US20010047310A1 (en) 2000-03-27 2001-11-29 Russell Randall A. School commerce system and method
AU2001245418A1 (en) 2000-03-28 2001-10-08 Tellabs Operations, Inc. Perceptual spectral weighting of frequency bands for adaptive noise cancellation
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
EP1467350B1 (en) * 2001-12-25 2009-01-14 NTT DoCoMo, Inc. Signal coding
US7283966B2 (en) * 2002-03-07 2007-10-16 Microsoft Corporation Scalable audio communications utilizing rate-distortion based end-to-end bit allocation
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7676043B1 (en) * 2005-02-28 2010-03-09 Texas Instruments Incorporated Audio bandwidth expansion
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Also Published As

Publication number Publication date
WO2007093726A2 (fr) 2007-08-23
KR20080093450A (ko) 2008-10-21
EP1989706A2 (fr) 2008-11-12
ATE531037T1 (de) 2011-11-15
US20090076829A1 (en) 2009-03-19
CN101385079A (zh) 2009-03-11
EP1989706B1 (fr) 2011-10-26
WO2007093726A3 (fr) 2007-10-18
US8260620B2 (en) 2012-09-04
CN101385079B (zh) 2012-08-29
JP2009527017A (ja) 2009-07-23
KR101366124B1 (ko) 2014-02-21

Similar Documents

Publication Publication Date Title
JP5117407B2 (ja) オーディオ符号化/復号化で知覚的に重み付けするための装置
KR101425944B1 (ko) 디지털 오디오 신호에 대한 향상된 코딩/디코딩
JP5112309B2 (ja) 階層符号化/復号化装置
JP4708446B2 (ja) 符号化装置、復号装置およびそれらの方法
JP5235684B2 (ja) 信号包絡線の量子化インデックスをバイナリ符号化する方法、信号包絡線を復号化する方法、および、対応する符号化および復号化モジュール
US8965775B2 (en) Allocation of bits in an enhancement coding/decoding for improving a hierarchical coding/decoding of digital audio signals
KR100721537B1 (ko) 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US8812327B2 (en) Coding/decoding of digital audio signals
CA2918835A1 (en) Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
WO2010028292A1 (en) Adaptive frequency prediction
WO2012053150A1 (ja) 音声符号化装置および音声復号化装置
WO2013061531A1 (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
EP2814028A1 (en) Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
KR101373207B1 (ko) 오디오 디코더에서 신호를 사후-프로세싱하는 방법
EP2132732B1 (en) Postfilter for layered codecs
Herre et al. 18. Perceptual Perceptual Audio Coding of Speech Signals
Seto Scalable Speech Coding for IP Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121017

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees