JP4963963B2 - スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法 - Google Patents

スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法 Download PDF

Info

Publication number
JP4963963B2
JP4963963B2 JP2006535201A JP2006535201A JP4963963B2 JP 4963963 B2 JP4963963 B2 JP 4963963B2 JP 2006535201 A JP2006535201 A JP 2006535201A JP 2006535201 A JP2006535201 A JP 2006535201A JP 4963963 B2 JP4963963 B2 JP 4963963B2
Authority
JP
Japan
Prior art keywords
lsp
scalable
lpc
wideband
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006535201A
Other languages
English (en)
Other versions
JPWO2006030865A1 (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006535201A priority Critical patent/JP4963963B2/ja
Publication of JPWO2006030865A1 publication Critical patent/JPWO2006030865A1/ja
Application granted granted Critical
Publication of JP4963963B2 publication Critical patent/JP4963963B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等において、音声通信を行う際に用いられる通信端末装置および基地局装置、ならびにこれらの装置に搭載されるスケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法に関する。
VoIP(Voice over IP)等のようにパケットを用いた音声通信においては、音声データの符号化にフレーム消失耐性のある符号化方式が望まれている。インターネット通信に代表されるパケット通信においては、輻輳等により伝送路上でパケットが破棄されることがあるからである。
フレーム消失耐性を高める方法の一つとして、伝送情報の一部が消失しても他の一部から復号処理を行うようにすることでフレーム消失の影響をできるだけ少なくするアプローチがある(例えば、特許文献1参照)。特許文献1には、スケーラブル符号化を用いてコアレイヤ符号化情報と拡張レイヤの符号化情報とを別々のパケットに詰めて伝送する方法が開示されている。また、パケット通信のアプリケーションとして、太い回線(ブロードバンド回線)と細い回線(伝送レートの低い回線)とが混在するネットワークを用いたマルチキャスト通信(一対多の通信)が挙げられる。このような不均一なネットワーク上で多地点間通信を行う場合にも、それぞれのネットワークに対応して符号化情報が階層化されていれば、ネットワークごとに異なる符号化情報を送る必要がないため、スケーラブル符号化が有効である。
例えば、音声信号の高能率な符号化を可能とするCELP(Code Excited Linear Prediction)方式をベースとして、信号帯域幅に(周波数軸方向に)スケーラビリティを有する帯域スケーラブル符号化技術として、特許文献2に開示されている技術がある。特許文献2では、音声信号のスペクトル包絡情報をLSP(Line Spectrum Pair:線スペクトル対)パラメータで表現するCELP方式の例が示されている。ここでは、狭帯域音声用の符号化部(コアレイヤ)で得られた量子化LSPパラメータ(狭帯域符号化LSP)を以下の式(1)
fw(i)=0.5×fn(i) [ただし、i=0,…,P−1]
=0.0 [ただし、i=P,…,P−1] ・・・(1)
を用いて広帯域音声符号化用のLSPパラメータに変換し、変換したLSPパラメータを広帯域音声用の符号化部(拡張レイヤ)で用いることにより、帯域スケーラブルなLSP符号化方法を実現している。なお、fw(i)は広帯域信号におけるi次のLSPパラメータ、fn(i)は狭帯域信号におけるi次のLSPパラメータ、Pは狭帯域信号のLSP分析次数、Pは広帯域信号のLSP分析次数をそれぞれ示している。ちなみに、LSPは、LSF(Line Spectral Frequency)とも呼ばれる。
特開2003−241799号公報 特開平11−30997号公報
しかしながら、特許文献2においては、狭帯域音声符号化で得られた量子化LSPパラメータ(狭帯域LSP)を単純に定数倍して、広帯域信号に対するLSPパラメータ(広帯域LSP)の予測に用いているだけなので、狭帯域LSPの情報を最大限活用している
とは言えず、式(1)に基づいて設計された広帯域LSP符号化器は、量子化効率等の符号化性能が不十分である。
本発明の目的は、量子化効率の高い高性能な帯域スケーラブルLSP符号化を実現することができるスケーラブル符号化装置スケーラブル復号装、スケーラブル符号化方法およびスケーラブル復号方法を提供することである。
上記課題を解決するために本発明に係るスケーラブル符号化装置は、狭帯域の量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化を行うスケーラブル符号化装置であって、前記狭帯域の量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシス手段と、前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換手段と、前記プリエンファシスされたLSPパラメータを広帯域形態に変換し、広帯域LSPパラメータを出力する変換手段と、前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類手段と、前記クラス情報を入力して多段ベクトル量子化を行う多段ベクトル量子化符号帳と、を備え、前記多段ベクトル量子化符号帳は、多段階の符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳から構成されており、前記クラス情報に対応するサブ符号帳を選択的に使用して前記予測量子化を行う構成を採る。
また、本発明に係るスケーラブル復号装置は、狭帯域の復号量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化の逆量子化を行うスケーラブル復号装置であって、前記狭帯域の復号量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシス手段と、前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換手段と、前記プリエンファシスされたLSPパラメータを広帯域形態へ変換し、広帯域LSPパラメータを出力する変換手段と、前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類手段と、前記クラス情報を入力して多段ベクトル量子化の逆量子化を行う多段ベクトル量子化符号帳と、を備え、前記多段ベクトル量子化符号帳は、多段階の符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳から構成されており、前記クラス情報に対応するサブ符号帳を選択的に使用して前記逆量子化を行う構成を採る。
また、本発明に係るスケーラブル符号化方法は、狭帯域の量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化を行うスケーラブル符号化方法であって、前記狭帯域の量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシスステップと、前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換ステップと、前記プリエンファシスされたLSPパラメータを広帯域形態に変換し、広帯域LSPパラメータを出力する変換ステップと、前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類ステップと、前記クラス情報を入力して多段ベクトル量子化を行う多段ベクトル量子化符号ステップと、を備え、前記多段ベクトル量子化符号ステップでは、多段ベクトル量子化符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳からなり、前記クラス情報に対応するサブ符号帳を選択的に使用して前記予測量子化を行うようにした。
また、本発明に係るスケーラブル復号方法は、狭帯域の復号量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化の逆量子化を行うスケーラブル復号方法であって、前記狭帯域の復号量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシスステップと、前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換ステップと、前記プリエンファシスされたLSPパラメータを広帯域形態へ変換し、広帯域LSPパラメータを出力する変換ステップと、前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類ステップと、前記クラス情報を入力して多段ベクトル量子化の逆量子化を行う多段ベクトル量子化符号ステップと、を備え、前記多段ベクトル量子化符号ステップでは、多段ベクトル量子化符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳からなり、前記クラス情報に対応するサブ符号帳を選択的に使用して前記逆量子化を行うようにした。
本発明によれば、狭帯域LSPに対してプリエンファシス処理を施すことにより、狭帯域信号の分析時はプリエンファシスを使用せず、広帯域信号の分析時はプリエンファシスを使用する構成となっているスケーラブル符号化装置においても、狭帯域LSPを用いた広帯域LSPの予測量子化を高性能に行うことができる。
また、本発明によれば、狭帯域LSPの情報を用いて広帯域LSPパラメータを適応符号化することにより、量子化効率の高い高性能な帯域スケーラブルLSP符号化を実現することができる。
さらに、本発明によれば、広帯域LSPパラメータの符号化において、先ず広帯域LSPパラメータがクラス分類され、次いで分類されたクラスに対応付けされたサブ符号帳が選択され、さらに選択されたサブ符号帳を用いて多段階ベクトル量子化が行われるため、符号化データに原信号の特徴を精度良く反映させることができるとともに、これらのサブ符号帳を有する多段階ベクトル量子化符号帳のメモリ量を抑えることができる。
図1は、16次の広帯域LSP(広帯域信号から16次のLSPを求めたもの:図1の左図)と8次の狭帯域LSP(狭帯域信号から8次のLSPを求めて式(1)によって変換されたもの:図1の右図)を横軸にフレーム番号をとってプロットしたグラフである。これらのグラフにおいて、横軸は時間(分析フレーム番号)、縦軸は正規化周波数(1.0=ナイキスト周波数(この例では8kHz))である。
これらのグラフから次のようなことが示唆される。第一に、式(1)によって得られるLSPは、必ずしも高い精度で近似できているわけではないが、広帯域LSPの低域側8次を近似するものとして妥当なものとなっている。第二に、狭帯域信号は3.4kHz付近で信号成分がなくなる(減衰する)ため、広帯域LSPが正規化周波数0.5近くにある場合、対応する狭帯域LSPは3.4kHz付近にクリッピングされたようになり、式(1)によって得られる近似値の誤差が大きくなる。逆に言うと、狭帯域LSPの8番目の要素が、3.4kHz付近にある場合、広帯域LSPの8番目の要素は3.4kHz以上の周波数に存在する可能性が高くなる、というように狭帯域LSPから広帯域LSPの特徴をある程度予測することができる。
つまり、(1)狭帯域LSPは広帯域LSPの低次半分の特徴をほぼ表現している、(2)広帯域LSPと狭帯域LSPとの間にはある程度相関があり、狭帯域LSPが分かると、広帯域LSPとしてあり得る候補をある程度絞り込むことができる、と考えられる。特に音声信号のようなものを考えた場合、狭帯域LSPが決まると、そのような特徴を包含するような広帯域LSPは、一意に決まらないながらも、ある程度絞り込まれる(例えば狭帯域LSPが「あ」という音声信号の特徴をもつ場合、広帯域LSPも「あ」という音声信号の特徴をもつ可能性が高く、そのような特徴を有するLSPパラメータのパターンが存在するベクトル空間はある程度限定される)。
このような狭帯域信号から得られるLSPと広帯域信号から得られるLSPとの相互関係を積極的に利用することにより、広帯域信号から得られるLSPの量子化効率を上げることが可能である。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図2は、本発明の実施の形態1に係るスケーラブル符号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル符号化装置は、狭帯域−広帯域変換部200、増幅器
201、増幅器202、遅延器203、除算器204、増幅器205、増幅器206、分類器207、多段階ベクトル量子化符号帳208、増幅器209、予測係数テーブル210、加算器211、遅延器212、減算器213および誤差最小化部214を備える。多段階ベクトル量子化符号帳208は、初段符号帳250、切り換えスイッチ251、2段目符号帳(CBb)252、3段目符号帳(CBc)253および加算器254、255を備える。
本実施の形態に係るスケーラブル符号化装置の各部は以下の動作を行う。
狭帯域−広帯域変換部200は、入力された量子化狭帯域LSP(図示しない狭帯域LSP量子化器によって予め量子化された狭帯域信号のLSPパラメータ)を式(1)などを用いて広帯域LSPパラメータに変換し、増幅器201、遅延器203、増幅器206および分類器207に出力する。なお、狭帯域LSPパラメータを広帯域LSPパラメータに変換する方法について、式(1)を用いる場合に、広帯域信号と狭帯域信号とのサンプリング周波数およびLSP次数の関係がともに2倍(広帯域信号のサンプリング周波数は狭帯域信号のサンプリング周波数の2倍で、広帯域LSPの分析次数も狭帯域LSPの分析次数の2倍)の関係になければ、得られる広帯域LSPパラメータと実際の入力広帯域LSPとの対応がとれなくなるので、両者が2倍の関係にないときには、広帯域LSPパラメータを一旦自己相関係数に変換し、この自己相関係数をアップサンプルし、アップサンプルした自己相関係数を広帯域LSPパラメータに再度変換すると良い。
以下においては、狭帯域−広帯域変換部200で広帯域形態に変換された量子化狭帯域LSPパラメータのことを、変換広帯域LSPパラメータと記載することもある。
増幅器201は、狭帯域−広帯域変換部200から入力された変換広帯域LSPパラメータに対して除算器204から入力された増幅係数を乗じて、増幅器202へ出力する。
増幅器202は、予測係数テーブル210から入力された予測係数β(ベクトル要素ごとに値をもつ)を、増幅器201から入力された変換広帯域LSPパラメータに乗じて、加算器211へ出力する。
遅延器203は、狭帯域−広帯域変換部200から入力された変換広帯域LSPパラメータを1フレームの時間遅延させて除算器204へ出力する。
除算器204は、遅延器212から入力された1フレーム前における量子化広帯域LSPパラメータを、遅延器203から入力された1フレーム前における量子化変換広帯域LSPパラメータで除算し、結果を増幅器201へ出力する。
増幅器205は、遅延器212から入力された1フレーム前における量子化広帯域LSPパラメータに、予測係数テーブル210から入力される予測係数β(ベクトル要素ごとに値を持つ)を乗じて加算器211へ出力する。
増幅器206は、狭帯域−広帯域変換部200から入力される変換広帯域LSPパラメータに、予測係数テーブル210から入力される予測係数β(ベクトル要素ごとに値をもつ)を乗じて、加算器211へ出力する。
分類器207は、狭帯域−広帯域変換部200から入力される変換広帯域LSPパラメータを用いてクラス分類を行い、その分類されたクラスを示すクラス情報を多段階ベクトル量子化符号帳208内の切り換えスイッチ251へ出力する。ここで、クラス分類には、どのような方法を用いても良いが、例えば、分類器207が、分類されるクラスの種類
の数と同じだけコードベクトルを格納した符号帳を具備していて、入力された変換広帯域LSPパラメータと前記格納されているコードベクトルとの2乗誤差が最小となるコードベクトルに対応するクラス情報を出力するようにしても良い。また、この2乗誤差には聴覚特性を考慮した重み付けを行っても良い。なお、分類器207の具体的な構成例については、後述する。
切り換えスイッチ251は、分類器207から入力されたクラス情報に対応付けされたサブ符号帳(CBa1〜CBan)を初段符号帳250の中から一つ選び、そのサブ符号帳の出力端子を加算器254に接続する。本実施の形態では、分類器207によって分類されるクラス数をnとし、サブ符号帳がn種類あり、n種類の中から指定されたクラスのサブ符号帳の出力端子に切り換えスイッチ251が接続されるものとする。
初段符号帳250は、誤差最小化部214からの指示により、指示されたコードベクトルを切り換えスイッチ251を介して加算器254へ出力する。
2段目符号帳252は、誤差最小化部214からの指示により、指示されたコードベクトルを加算器254へ出力する。
加算器254は、切り換えスイッチ251から入力された初段符号帳250のコードベクトルと、2段目符号帳252から入力されたコードベクトルとを加算し、加算器255へ出力する。
3段目符号帳253は、誤差最小化部214からの指示により、指示されたコードベクトルを加算器255へ出力する。
加算器255は、加算器254から入力されるベクトルと、3段目符号帳253から入力されるコードベクトルとを加算し、増幅器209へ出力する。
増幅器209は、加算器255から入力されるベクトルに、予測係数テーブル210から入力される予測係数α(ベクトル要素ごとに値をもつ)を乗じて、加算器211へ出力する。
予測係数テーブル210は、誤差最小化部214からの指示により、格納している予測係数セットの中から指示された1セットを選び、選択した予測係数セットの中から増幅器202、205、206、209用の係数を増幅器202、205、206、209のそれぞれに出力する。なお、この予測係数セットは、増幅器202、205、206、209のそれぞれに対してLSPの次数毎に用意された係数からなる。
加算器211は、増幅器202、205、206、209からそれぞれ入力されるベクトルを加算し、減算器213へ出力する。加算器211の出力は、量子化広帯域LSPパラメータとして図2のスケーラブル符号化装置の外部へ出力されるとともに、遅延器212にも出力される。図2のスケーラブル符号化装置の外部へ出力された量子化広帯域LSPパラメータは、音声信号を符号化する図示しない他のブロック等での処理に用いられる。なお、後述する誤差最小化部214によって、誤差を最小にするパラメータ(各符号帳から出力されるコードベクトルおよび予測係数セット)が決定されると、そのとき加算器211から出力されるベクトルが量子化広帯域LSPパラメータとなる。量子化広帯域LSPパラメータは遅延器212に出力される。なお、加算器211の出力信号を式で表すと次式(2)のようになる。
Figure 0004963963
また、広帯域の量子化LSPパラメータとして出力されるLSPパラメータが安定条件(第n次のLSPは第0次〜第(n−1)次のいずれのLSPよりも大きい、すなわち、LSPは次数の順番に値が大きくなる)を満たしていない場合は、加算器211は、LSPの安定条件を満たすように操作を加える。なお、加算器211は、隣接する量子化LSPの間隔が所定の間隔より狭い場合も、所定の間隔以上になるように操作する。
減算器213は、外部から入力される(広帯域信号を分析して得られた)、量子化ターゲットとなる広帯域LSPパラメータと、加算器211から入力される量子化LSPパラメータ候補(量子化広帯域LSP)と、の誤差を計算し、求まった誤差を誤差最小化部214へ出力する。なお、この誤差計算は、入力されたLSPベクトル間の二乗誤差で良い。また、入力されたLSPベクトルの特徴に応じて重み付けを行うようにすれば、さらに聴感上の品質を良くすることができる。例えば、ITU−T勧告G.729では、3.2.4章(Quantization of the LSP coefficients)の(21)式の重み付け二乗誤差(重み付けユークリッド距離)を用いて誤差最小化を行う。
誤差最小化部214は、減算器213から出力される誤差が最小となる各符号帳のコードベクトルおよび予測係数セットを、多段階ベクトル量子化符号帳208および予測係数テーブル210のそれぞれの中から選択する。選択したパラメータ情報は符号化され、符号化データとして出力される。
図3は、分類器207の主要な構成を示すブロック図である。分類器207は、n個のコードベクトル(CV)格納部411および切替器412を有する分類用符号帳410と、誤差算出部421と、誤差最小化部422とを具備する。
CV格納部411は、分類器207において分類されるクラス数と同数すなわちn個設けられる。CV411−1〜411−nはそれぞれ、分類される各クラスに対応するコードベクトルを格納しており、切替器412によって誤差算出部421と接続されたときに、その格納するコードベクトルを切替器412を介して誤差算出部421に入力する。
切替器412は、誤差最小化部422からの指示に応じて誤差算出部421に接続するCV格納部411を順次切り替えて、CV1〜CVnを全て誤差算出部421に入力する
誤差算出部421は、狭帯域−広帯域変換部200から入力される変換広帯域LSPパラメータと、分類用符号帳410から入力されるCVk(k=1〜n)と、の2乗誤差を逐次算出して誤差最小化部422に入力する。なお、誤差算出部421は、ベクトルのユークリッド距離に基づいてこの2乗誤差を算出しても良いし、予め重み付けされたベクトルのユークリッド距離に基づいて2乗誤差を算出しても良い。
誤差最小化部422は、誤差算出部421から変換広帯域LSPパラメータとCVkとの2乗誤差が入力されるごとに、分類用符号帳410から誤差算出部421にCVk+1が入力されるように切替器412に対して指示するとともに、CV1〜CVnについての2乗誤差を蓄積し、蓄積した中で最小の2乗誤差を示すクラス情報を生成して切り換えスイッチ251に入力する。
以上、本実施の形態に係るスケーラブル符号化装置について詳細に説明した。
図4は、上記のスケーラブル符号化装置で符号化された符号化データを復号化するスケーラブル復号化装置の主要な構成を示すブロック図である。このスケーラブル復号化装置における符号化データの復号に関連する部分以外は、図2のスケーラブル符号化装置と同じ動作をする。なお、図2のスケーラブル符号化装置と同じ動作をする同一の構成要素には、同一の参照符号を付して、その説明を省略する。
このスケーラブル復号化装置は、狭帯域−広帯域変換部200、増幅器201、増幅器202、遅延器203、除算器204、増幅器205、増幅器206、分類器207、多段階ベクトル量子化符号帳308、増幅器209、予測係数テーブル310、加算器211、遅延器212およびパラメータ復号部314を備える。多段階ベクトル量子化符号帳308は、初段符号帳350、切り換えスイッチ251、2段目符号帳(CBb)352、3段目符号帳(CBc)353および加算器254、255を備える。
パラメータ復号部314は、本実施の形態に係るスケーラブル符号化装置で符号化された符号化データを受け取り、多段階ベクトル量子化(VQ)符号帳308の各段符号帳350、352、353と予測係数テーブル310に対して、各符号帳、テーブルが出力するべきコードベクトル、予測係数セットの情報を出力する。
初段符号帳350は、パラメータ復号部314から入力された情報が示すコードベクトルを切り換えスイッチ251が選択したサブ符号帳(CBa1〜CBan)の中から取り出し、切り換えスイッチ251を介して加算器254へ出力する。
2段目符号帳352は、パラメータ復号部314から入力された情報が示すコードベクトルを取り出し、加算器254へ出力する。
3段目符号帳353は、パラメータ復号部314から入力された情報が示すコードベクトルを取り出し、加算器255へ出力する。
予測係数テーブル310は、パラメータ復号部314から入力された情報が示す予測係数セットを取り出し、増幅器202、205、206、209へ対応する予測係数を出力する。
ここで、多段階VQ符号帳308および予測係数テーブル310に格納されているコードベクトルおよび予測係数セットは、図2のスケーラブル符号化装置における多段階VQ
符号帳208および予測係数テーブル210と同一である。また、動作も同じである。多段階VQ符号帳および予測係数テーブルへ指示を送る部分が、誤差最小化部214かパラメータ復号部314かの違いだけである。
加算器211の出力は、量子化広帯域LSPパラメータとして図4のスケーラブル復号化装置の外部へ出力されるとともに、遅延器212へ出力される。図4のスケーラブル復号化装置の外部へ出力した量子化広帯域LSPパラメータは、音声信号を復号するブロック等での処理に用いられる。
以上、本実施の形態に係るスケーラブル復号化装置について詳細に説明した。
このように、本実施の形態では、現在のフレームにおいて復号化された狭帯域の量子化LSPパラメータを用いて、現在のフレームにおける広帯域LSPパラメータの符号化を適応的に行う。具体的には、量子化広帯域LSPパラメータのクラス分類を行い、分類されたクラスそれぞれに専用のサブ符号帳(CBa1〜CBan)を用意し、分類結果によって前記サブ符号帳を切り換えて使用し、広帯域LSPパラメータのベクトル量子化を行う。この構成を採ることにより、本実施の形態によれば、既に量子化されている狭帯域LSPの情報をもとに、広帯域LSPパラメータの量子化に適した符号化を行うことができ、広帯域LSPパラメータの量子化性能を高めることができる。
また、本実施の形態によれば、上記クラス分類は、既に符号化(復号化)が終了している量子化狭帯域LSPパラメータを用いて行なわれるので、例えば、復号化側において符号化側からクラス分類情報を別途取得する必要がない。すなわち、本実施の形態によれば、通信の伝送レートを増加させることなしに広帯域LSPパラメータの符号化性能を改善することができる。
また、本実施の形態では、サブ符号帳(CBa1〜CBan)を含む多段階ベクトル量子化符号帳208、308における初段符号帳250、350が符号化対象の基本的な特徴を表現するように予め設計される。例えば、多段階ベクトル量子化符号帳208、308において、2段目以降は雑音的な誤差成分の符号化になるよう、平均的な成分やバイアス成分などは全て初段符号帳250、350に反映させるなどする。このようにすれば、初段符号帳250、350のコードベクトルの平均エネルギは2段目以降よりも大きくなるため、多段階ベクトル量子化符号帳208、308で生成されるベクトルの主要成分を初段符号帳250、350で表現できるようになる。
また、本実施の形態では、分類器207でのクラス分類に応じてサブ符号帳を切り換える符号帳は初段符号帳250、350のみとする、すなわち格納されたコードベクトルの平均エネルギが最大となる初段符号帳のみがサブ符号帳を有するようにする。このようにすれば、多段階ベクトル量子化符号帳208、308の有する全ての符号帳をクラス毎に切り換える場合に比べて、コードベクトルの格納に必要なメモリ量を抑制することができる。さらに、このようにすれば、初段符号帳250、350を切り換えるだけでも大きな切り換え効果を得ることが可能となり、広帯域LSPパラメータの量子化性能を効果的に改善することができる。
なお、本実施の形態では、誤差算出部421が広帯域LSPパラメータと分類用符号帳410からのコードベクトルとの2乗誤差を算出し、誤差最小化部422がその2乗誤差を蓄積して最小の誤差となるものを選択する場合について説明したが、これと等価すなわち結果として広帯域LSPパラメータとコードベクトルとの誤差が最小となるものが選択されるような処理であれば、必ずしも厳密に前記2乗誤差を算出しなくても良い。また、演算量削減のために前記2乗誤差の計算の一部を省略するなどして、誤差が準最小となる
ベクトルを選択する処理としても良い。
(実施の形態2)
図5は、本発明の実施の形態2に係るスケーラブル符号化装置またはスケーラブル復号化装置に具備される分類器507の主要な構成を示すブロック図である。本実施の形態に係るスケーラブル符号化装置またはスケーラブル復号化装置は、実施の形態1に係るスケーラブル符号化装置またはスケーラブル復号化装置における分類器207の代わりに分類器507を具備するものである。したがって、本実施の形態に係るスケーラブル符号化装置またはスケーラブル復号化装置の具備する構成要素の殆どは、実施の形態1に係るスケーラブル符号化装置またはスケーラブル復号化装置における構成要素と同一の動作を行うため、このような同一の動作を行う構成要素については、重複を避けるため、実施の形態1における参照符号と同一の参照符号を付して、その説明を省略する。
分類器507は、m個のCV格納部411を有する分類用符号帳510、誤差算出部521、類似度算出部522および分類決定部523を具備する。
分類用符号帳510は、CV格納部411−1〜411−mそれぞれが格納するm種類のCVを誤差算出部521に同時に入力する。
誤差算出部521は、狭帯域−広帯域変換部200から入力される変換広帯域LSPパラメータと、分類用符号帳510から入力されるCVk(k=1〜m)と、の2乗誤差を算出し、算出したm個の2乗誤差を全て類似度算出部522に入力する。なお、誤差算出部521は、ベクトルのユークリッド距離に基づいてこの2乗誤差を算出しても良いし、予め重み付けされたベクトルのユークリッド距離に基づいて2乗誤差を算出しても良い。
類似度算出部522は、誤差算出部521から入力されるm個の2乗誤差に基づいて、誤差算出部521に入力される変換広帯域LSPパラメータと、分類用符号帳510から入力されるCV1〜CVmと、の類似度を算出し、算出した類似度を分類決定部523に入力する。具体的には、類似度算出部522は、誤差算出部521から入力されるm個の2乗誤差それぞれについて、例えば類似度が最低の「0」から最高の「K−1」までのK個のランクにスカラ量子化することにより、そのm個の2乗誤差を類似度k(i),i=0〜K−1に変換する。
分類決定部523は、類似度算出部522から入力される類似度k(i),i=0〜K−1を用いてクラス分類を行い、分類されたクラスを示すクラス情報を生成して切り換えスイッチ251に入力する。ここで、分類決定部523は、例えば次式(3)を用いてクラス分類を行う。
Figure 0004963963
このように、本実施の形態によれば、類似度算出部522において、類似度がm個の2乗誤差のスカラ量子化結果から算出されるため、その算出に要する演算量を少なく抑えることができる。また、本実施の形態によれば、類似度算出部522において、m個の2乗誤差がK個のランクで表される類似度に変換されるため、CV1からCVmまでの間の中間的なCVを生成できることから、CV格納部411の種類数mが少なくても、分類器507によって分類されるクラスの数を増やすことができる。換言すれば、本実施の形態によれば、分類器507から切り換えスイッチ251に入力されるクラス情報の品質を低下
させることなく、分類用符号帳510におけるコードベクトルの格納用メモリ量を削減することができる。
(実施の形態3)
図6は、本発明の実施の形態3に係るスケーラブル音声符号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル音声符号化装置は、ダウンサンプル処理部601、LP分析部(NB)602、LPC量子化部(NB)603、音源符号化部(NB)604、プリエンファシスフィルタ605、LP分析部(WB)606、LPC量子化部(WB)607、音源符号化部(WB)608、多重化部609を備える。
ダウンサンプル処理部601は、入力された広帯域信号に対して、デシメーションとLPF(低域通過フィルタ)処理を組み合わせた一般的なダウンサンプリング処理を行い、狭帯域信号をLP分析部(NB)602および音源符号化部(NB)604にそれぞれ出力する。
LP分析部(NB)602は、ダウンサンプル処理部601から入力された狭帯域信号の線形予測分析を行い、線形予測係数をLPC量子化部(NB)603に出力する。
LPC量子化部(NB)603は、LP分析部(NB)602から入力された線形予測係数の量子化を行い、符号化情報を多重化部609へ出力するとともに、量子化された線形予測パラメータをLPC量子化部(WB)607および音源符号化部(NB)604にそれぞれ出力する。ここで、LPC量子化部(NB)603は、線形予測係数をLSP(LSF)等のスペクトルパラメータに変換してから量子化処理を行う。LPC量子化部(NB)603から出力される量子化線形予測パラメータは、スペクトルパラメータでも線形予測係数でもよい。
音源符号化部(NB)604は、LPC量子化部(NB)603から入力された線形予測パラメータを線形予測係数に変換し、得られた線形予測係数に基づく線形予測フィルタを構築する。構築した線形予測フィルタによって合成される信号とダウンサンプル処理部601から入力される狭帯域信号との誤差を最小とするように線形予測フィルタの駆動音源信号の符号化を行い、音源符号化情報を多重化部609へ出力し、復号音源信号(量子化音源信号)を音源符号化部(WB)608へ出力する。
プリエンファシスフィルタ605は、入力された広帯域信号の高域強調処理(伝達関数は1−μz-1、μ:フィルタ係数、z−1:z変換における複素変数で遅延演算子と呼ばれる)を行い、LP分析部(WB)606および音源符号化部(WB)608に出力する。
LP分析部(WB)606は、プリエンファシスフィルタ605から入力されたプリエンファシス後の広帯域信号の線形予測分析を行い、線形予測係数をLPC量子化部(WB)607へ出力する。
LPC量子化部(WB)607は、LP分析部(WB)606から入力された線形予測係数をLSP(LSF)等のスペクトルパラメータに変換し、得られたスペクトルパラメータとLPC量子化部(NB)603から入力された量子化線形予測パラメータ(狭帯域)とを用いて、例えば後述するスケーラブル符号化装置を用いて、線形予測パラメータ(広帯域)の量子化処理を行い、符号化情報を多重化部609へ出力するとともに、量子化された線形予測パラメータを音源符号化部(WB)608へ出力する。
音源符号化部(WB)608は、LPC量子化部(WB)607から入力された量子化線形予測パラメータを線形予測係数に変換し、得られた線形予測係数に基づく線形予測フィルタを構築する。構築した線形予測フィルタによって合成される信号とプリエンファシスフィルタ605から入力される広帯域信号との誤差を最小とするように前記線形予測フィルタの駆動音源信号の符号化を行い、音源符号化情報を多重化部609へ出力する。広帯域信号の音源符号化においては、音源符号化部(NB)604から入力される狭帯域信号の復号音源信号(量子化音源信号)を利用すると効率的な符号化を行うことができる。
多重化部609は、LPC量子化部(NB)603、音源符号化部(NB)604、LPC量子化部(WB)607および音源符号化部(WB)608から入力された各種符号化情報の多重化を行い、多重化信号を伝送路へ送出する。
図7は、本発明の実施の形態3に係るスケーラブル音声復号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル音声復号化装置は、多重分離部700、LPC復号化部(NB)701、音源復号化部(NB)702、LP合成部(NB)703、LPC復号化部(WB)704、音源復号化部(WB)705、LP合成部(WB)706、デエンファシスフィルタ707を備える。
多重分離部700は、本実施の形態に係るスケーラブル音声符号化装置からから送出された多重化信号を受信し、各種符号化情報に分離した後、量子化狭帯域線形予測係数符号化情報をLPC復号化部(NB)701へ、狭帯域音源符号化情報を音源復号化部(NB)702へ、量子化広帯域線形予測係数符号化情報はLPC復号化部(WB)704へ、広帯域音源符号化情報は音源復号化部(WB)705へそれぞれ出力する。
LPC復号化部(NB)701は、多重分離部700から入力された量子化狭帯域線形予測符号化情報の復号処理を行い、量子化狭帯域線形予測係数を復号し、LP合成部(NB)703およびLPC復号化部(WB)704へ出力する。ただし、スケーラブル音声符号化装置において述べたように、量子化は線形予測係数をLSP(またはLSF)に変換して行われているので、この復号によって得られる情報は線形予測係数そのものではなく、LSPパラメータである。復号LSPパラメータは、LP合成部(NB)703およびLPC復号化部(WB)704へ出力される。
音源復号化部(NB)702は、多重分離部700から入力された狭帯域音源符号化情報の復号処理を行い、LP合成部(NB)703および音源復号化部(WB)705へ出力する。
LP合成部(NB)703は、LPC復号化部(NB)701から入力された復号LSPパラメータを線形予測係数に変換し、これを用いて線形予測フィルタを構築し、音源復号化部(NB)702から入力された復号狭帯域音源信号を線形予測フィルタの駆動音源信号として、狭帯域信号を生成する。
LPC復号化部(WB)704は、多重分離部700から入力された量子化広帯域線形予測係数符号化情報と、LPC復号化部(NB)701から入力された狭帯域の復号LSPパラメータとを用いて、例えば後述するスケーラブル復号化装置を用いて広帯域のLSPパラメータを復号し、LP合成部(WB)706へ出力する。
音源復号化部(WB)705は、多重分離部700から入力された広帯域音源符号化情
報と、音源復号化部(NB)702から入力された復号狭帯域音源信号とを用いて、広帯域音源信号を復号し、LP合成部(WB)706へ出力する。
LP合成部(WB)706は、LPC復号化部(WB)704から入力された復号広帯域LSPパラメータを線形予測係数に変換し、これを用いて線形予測フィルタを構築し、音源復号化部(WB)705から入力した復号広帯域音源信号を線形予測フィルタの駆動音源信号として、広帯域信号を生成し、デエンファシスフィルタ707へ出力する。
デエンファシスフィルタ707は、スケーラブル音声符号化装置のプリエンファシスフィルタ605と逆特性のフィルタである。デエンファシスされた信号は復号された広帯域信号として出力される。
なお、低域部はLP合成部(NB)703によって生成された狭帯域信号をアップサンプルして得られるものを用いるようにして広帯域信号を復号することも可能である。この場合、デエンファシスフィルタ707から出力された広帯域信号を適切な周波数特性を有する高域通過フィルタにかけ、前記アップサンプルした狭帯域信号と加算するようにすれば良い。狭帯域信号にはポストフィルタをかけて聴覚的な品質を改善するとなお良い。
図8は、LPC量子化部(WB)607の主要な構成を示すブロック図である。LPC量子化部(WB)607は、狭帯域−広帯域変換部200、LSP−LPC変換部800、プリエンファシス部801、LPC−LSP変換部802、予測量子化部803を備える。予測量子化部803は、増幅器201、増幅器202、遅延器203、除算器204、増幅器205、増幅器206、分類器207、多段階ベクトル量子化符号帳208、増幅器209、予測係数テーブル210、加算器211、遅延器212、減算器213および誤差最小化部214を備える。多段階ベクトル量子化符号帳208は、初段符号帳250、切り換えスイッチ251、2段目符号帳(CBb)252、3段目符号帳(CBc)253および加算器254、255を備える。
図8に示したスケーラブル符号化装置(LPC量子化部(WB)607)は、LSP−LPC変換部800、プリエンファシス部801およびLPC−LSP変換部802が図2のスケーラブル符号化装置に新たに追加されたものである。したがって、本実施の形態に係るスケーラブル符号化装置の具備する構成要素の殆どは、実施の形態1に係るスケーラブル符号化装置における構成要素と同一の動作を行うため、このような同一の動作を行う構成要素については、重複を避けるため、実施の形態1における参照符号と同一の参照符号を付して、その説明を省略する。
LPC量子化部(NB)603から入力された量子化線形予測パラメータ(ここでは量子化狭帯域LSP)は、狭帯域−広帯域変換部200において広帯域LSPパラメータに変換され、変換広帯域LSPパラメータ(広帯域形態に変換された量子化狭帯域LSPパラメータ)がLSP−LPC変換部800へ出力される。
LSP−LPC変換部800は、狭帯域−広帯域変換部200から入力された変換広帯域LSPパラメータ(量子化線形予測パラメータ)を線形予測係数(量子化狭帯域LPC)に変換し、プリエンファシス部801へ出力する。
プリエンファシス部801は、LSP−LPC変換部800から入力された線形予測係数から、後述するような方法を用いて、プリエンファシスされた線形予測係数を算出し、LPC−LSP変換部802へ出力する。
LPC−LSP変換部802は、プリエンファシス部801から入力されたプリエンフ
ァシスされた線形予測係数を、プリエンファシスされた量子化狭帯域LSPに変換し、予測量子化部803へ出力する。
予測量子化部803は、LPC−LSP変換部802から入力されたプリエンファシスされた量子化狭帯域LSPを量子化広帯域LSPに変換し、予測量子化部803の外部へ出力する。予測量子化部803は、量子化広帯域LSPを出力するものであればどのような構成でも良いが、本実施の形態では、例として実施の形態1の図2に示した201〜212を構成要素としている。
図9は、LPC復号化部(WB)704の主要な構成を示すブロック図である。LPC復号化部(WB)704は、狭帯域−広帯域変換部200、LSP−LPC変換部800、プリエンファシス部801、LPC−LSP変換部802、LSP復号部903を備える。LSP復号部903は、増幅器201、増幅器202、遅延器203、除算器204、増幅器205、増幅器206、分類器207、多段階ベクトル量子化符号帳308、増幅器209、予測係数テーブル310、加算器211、遅延器212およびパラメータ復号部314を備える。多段階ベクトル量子化符号帳308は、初段符号帳350、切り換えスイッチ251、2段目符号帳(CBb)352、3段目符号帳(CBc)353および加算器254、255を備える。
図9に示したスケーラブル復号化装置(LPC復号化部(WB)704)は、図8に示したLSP−LPC変換部800、プリエンファシス部801およびLPC−LSP変換部802が図4のスケーラブル復号化装置に新たに追加されたものである。したがって、本実施の形態に係るスケーラブル音声復号化装置の具備する構成要素の殆どは、実施の形態1に係るスケーラブル復号化装置における構成要素と同一の動作を行うため、このような同一の動作を行う構成要素については、重複を避けるため、実施の形態1における参照符号と同一の参照符号を付して、その説明を省略する。
LPC復号化部(NB)701から入力された量子化狭帯域LSPは、狭帯域−広帯域変換部200において広帯域LSPパラメータに変換され、変換広帯域LSPパラメータ(広帯域形態に変換された量子化狭帯域LSPパラメータ)がLSP−LPC変換部800へ出力される。
LSP−LPC変換部800は、狭帯域−広帯域変換部200から入力された変換広帯域LSPパラメータ(変換後の量子化狭帯域LSP)を線形予測係数(量子化狭帯域LPC)に変換し、プリエンファシス部801へ出力する。
プリエンファシス部801は、LSP−LPC変換部800から入力された線形予測係数から、後述するような方法を用いて、プリエンファシスされた線形予測係数を算出し、LPC−LSP変換部802へ出力する。
LPC−LSP変換部802は、プリエンファシス部801から入力されたプリエンファシスされた線形予測係数を、プリエンファシスされた量子化狭帯域LSPに変換し、LSP復号部903へ出力する。
LSP復号部903は、LPC−LSP変換部802から入力されたプリエンファシスされた復号(量子化)狭帯域LSPを量子化広帯域LSPに変換し、LSP復号部903の外部へ出力する。LSP復号部903は、量子化広帯域LSPを出力するものであり、予測量子化部803と同一の量子化広帯域LSPを出力するものであればどのような構成でも良いが、本実施の形態では、例として実施の形態1の図4に示した201〜207,308,209,310,211,212を構成要素としている。
図10は、プリエンファシス部801における処理手順の一例を示すフロー図である。図10において、ステップ(以下、「ST」と省略する)1001では、入力した量子化狭帯域LPCで構成されるLP合成フィルタのインパルス応答を算出し、ST1002では、ST1001において算出したインパルス応答にプリエンファシスフィルタ605のインパルス応答を畳み込んで「プリエンファシスされた、LP合成フィルタのインパルス応答」を算出する。
ST1003では、ST1002において算出された「プリエンファシスされた、LP合成フィルタのインパルス応答」の自己相関係数を算出し、ST1004では、自己相関係数をLPCに変換し、プリエンファシスされた量子化狭帯域LPCを出力する。
なお、プリエンファシスするとは、スペクトルの傾きの影響を回避するために予めスペクトルの傾きを平坦化する処理のことであるため、プリエンファシス部801における処理は、図10に記載された具体的な処理方法に限定されるものではなく、他の処理方法でプリエンファシスを実施してもよい。
このように本実施の形態では、プリエンファシス処理を行うことにより、狭帯域LSFから広帯域LSFを予測する際の予測性能が向上し、量子化性能が改善される。特に、このようなプリエンファシス処理を図6に示した構成を有するスケーラブル音声符号化装置に導入することにより、人間の聴覚特性に適した音声符号化を行うことが可能となり、符号化音声の主観的な品質が改善される。
(実施の形態4)
図11は、本発明の実施の形態4に係るスケーラブル符号化装置の主要な構成を示すブロック図である。図11に示したスケーラブル符号化装置は、図6に示したLPC量子化部(WB)607に適用することができる。各ブロックの動作は図8で示したものと同一であるので、同じ番号を付して、説明を省略する。ただし、プリエンファシス部801とLPC−LSP変換部802については、動作は同じであるが、入出力のパラメータは狭帯域−広帯域変換される前の段階で行われる点が異なる。
実施の形態3の図8と本実施の形態の図11との違いは、以下に述べるとおりである。狭帯域信号(低速サンプリングレート)の領域でプリエンファシスを行うのが図11であり、広帯域信号(高速サンプリングレート)の領域でプリエンファシスを行うのが図8である。図11に示した構成では、サンプリングレートが低いので演算量の増加が少なくて済むという利点がある。なお、図8で用いるプリエンファシスの係数μは、あらかじめ適正な値(図6のプリエンファシスフィルタ605のμと異なり得る値)に調整しておくことが好ましい。
また、図11では、量子化狭帯域LPC(線形予測係数)が入力されるので、図6のLPC量子化部(NB)603から出力される量子化線形予測パラメータはLSPではなく、線形予測係数である。
図12は、本発明の実施の形態4に係るスケーラブル復号化装置の主要な構成を示すブロック図である。図12に示したスケーラブル復号化装置は、図7に示したLPC復号化部(WB)704に適用することができる。各ブロックの動作は図9で示したものと同一であるので、同じ番号を付して、説明を省略する。
また、プリエンファシス部801とLPC−LSP変換部802の動作については、図11について説明したものと同一であるので、説明を省略する。
また、図12では、量子化狭帯域LPC(線形予測係数)が入力されるので、図7のLPC復号化部(NB)701から出力される量子化線形予測パラメータはLSPではなく、線形予測係数である。
実施の形態3の図9と本実施の形態の図12との違いは、上記で説明した、図8と図12との違いと同様である。
以上、本発明の実施の形態について説明した。
なお、本発明に係るスケーラブル符号化装置は、ダウンサンプル処理部601においてダウンサンプルを行わずに帯域制限フィルタリング処理のみを行う構成としてもよい。この場合、サンプリング周波数は同じで信号の帯域幅のみが異なる狭帯域信号と広帯域信号とのスケーラブルな符号化が行われることとなり、狭帯域−広帯域変換部200の処理が不要となる。
なお、本発明に係るスケーラブル音声符号化装置は、上記の実施の形態3,4に限定されず、種々変更して実施することが可能である。例えば用いられるプリエンファシスフィルタ605の伝達関数は1−μz-1としたが、他の適切な特性を有するフィルタを用いた構成も可能である。
なお、本発明に係るスケーラブル符号化装置およびスケーラブル復号化装置は、上記の実施の形態1〜4に限定されず、種々変更して実施することが可能である。例えば、構成要素201〜205、212の全てまたは一部を取り除いた構成でも実施することが可能である。
本発明に係るスケーラブル符号化装置およびスケーラブル復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、ここでは、LSPパラメータを符号化/復号化する場合について説明したが、ISP(ImmittanceSpectrum Pairs)パラメータについても本発明は適用可能である。
また、上記各実施の形態において、狭帯域信号はサンプリング周波数8kHzの音響信号(一般的には、3.4kHz帯域の音響信号)のことを指すとともに、広帯域信号は狭帯域信号より広い帯域幅を有する音響信号(例えば、サンプリング周波数16kHzでの帯域幅7kHzの音響信号)のことを指し、それぞれ代表的には狭帯域音声信号及び広帯域音声信号のことを指しているが、狭帯域信号及び広帯域信号は必ずしもこれらに限定されるものではない。
また、ここでは、現フレームの狭帯域の量子化LSPパラメータを用いたクラス分類方法としてベクトル量子化手法を用いる例を示したが、反射係数や対数断面積比などのパラメータに変換してクラス分類に用いても良い。
また、上記クラス分類をベクトル量子化の手法に用いる場合においても、量子化LSPパラメータの全次数を用いずに低次側の限定された次数のみでおこなうようにしても良い。あるいは、量子化LSPパラメータの次数を下げたものに変換してからクラス分類を行っても良い。このようにすることで、クラス分類導入による演算量とメモリ量の増加を抑えることが可能となる。
また、ここでは、多段階ベクトル量子化の符号帳構成は3段階としたが、2段階以上であれば何段階であっても良い。また、一部の段階が分割ベクトル量子化になっていたり、スカラ量子化になっていたりしても良い。また、多段階構成となっておらず、分割構成となっている場合にも適用できる。
また、多段階ベクトル量子化符号帳は、予測係数テーブルのセットごとに異なる符号帳を具備し、異なる予測係数テーブルには異なる多段階ベクトル量子化符号帳を組み合わせて使う構成とすると、さらに量子化性能が上がる。
また、上記各実施の形態において、予測係数テーブル210、310は、分類器207の出力するクラス情報に対応する予測係数テーブルを予め用意しておき、それらを切り換えて出力するようにしても良い。つまり、予測係数テーブル210、310は、切り換えスイッチ251が分類器207から入力されたクラス情報に応じてサブ符号帳(CBa1〜CBan)を初段符号帳250の中から一つ選択するように、予測係数テーブルを切り換えて出力するようにしても良い。
さらに、上記各実施の形態において、初段符号帳250を切り換えないで、予測係数テーブル210、310の有する予測係数テーブルだけを切り換えるようにしても良いし、初段符号帳250と予測係数テーブル210、310の有する予測係数テーブルとの双方を同時に切り換えるようにしても良い。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、ここでは、狭帯域量子化LSPパラメータを広帯域量子化LSPパラメータに変換したものを用いてクラス分類を行う例を示したが、変換前の狭帯域LSPパラメータを用いてクラス分類を行うことも可能である。
なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年9月17日出願の特願2004−272481、2004年11月12日出願の特願2004−329094及び2005年9月2日出願の特願2005−255242に基づくものである。この内容は全てここに含めておく。
本発明に係るスケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法、およびスケーラブル復号方法は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置等の用途に適用できる。
広帯域と狭帯域のLSPパラメータの例をフレーム番号毎にプロットしたグラフを示す図 実施の形態1に係るスケーラブル符号化装置の主要な構成を示すブロック図 実施の形態1における分類器の主要な構成を示すブロック図 実施の形態1に係るスケーラブル復号化装置の主要な構成を示すブロック図 実施の形態2における分類器の主要な構成を示すブロック図 実施の形態3に係るスケーラブル音声符号化装置の主要な構成を示すブロック図 実施の形態3に係るスケーラブル音声復号化装置の主要な構成を示すブロック図 実施の形態3におけるLPC量子化部(WB)の主要な構成を示すブロック図 実施の形態3におけるLPC復号化部(WB)の主要な構成を示すブロック図 実施の形態3におけるプリエンファシス部の処理手順の一例を示すフロー図 実施の形態4に係るスケーラブル符号化装置の主要な構成を示すブロック図 実施の形態4に係るスケーラブル復号化装置の主要な構成を示すブロック図

Claims (14)

  1. 狭帯域の量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化を行うスケーラブル符号化装置であって、
    前記狭帯域の量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシス手段と、
    前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換手段と、
    前記プリエンファシスされたLSPパラメータを広帯域形態に変換し、広帯域LSPパラメータを出力する変換手段と、
    前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類手段と、
    前記クラス情報を入力して多段ベクトル量子化を行う多段ベクトル量子化符号帳と、
    を備え、
    前記多段ベクトル量子化符号帳は、多段階の符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳から構成されており、前記クラス情報に対応するサブ符号帳を選択的に使用して前記予測量子化を行う、
    スケーラブル符号化装置。
  2. 前記符号帳に格納されているコードベクトルの平均エネルギが最大となる段が初段である、
    請求項1記載のスケーラブル符号化装置。
  3. 前記プリエンファシス手段は、
    入力したLPCパラメータにより構成されるLP合成フィルタのインパルス応答を算出し、
    プリエンファシスフィルタのインパルス応答を前記LP合成フィルタのインパルス応答に畳み込んでプリエンファシスされたLP合成フィルタのインパルス応答を算出し、
    前記プリエンファシスされたLP合成フィルタのインパルス応答の自己相関係数を算出し、
    算出した前記自己相関係数をLPCパラメータに変換することによって、LPCパラメータのプリエンファシス処理を行う、
    請求項1記載のスケーラブル符号化装置。
  4. 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域LSPパラメータとの誤差が最小の前記コードベクトルを特定することによってクラス分類を行い、分類されたクラスを示すクラス情報を生成する、
    請求項1記載のスケーラブル符号化装置。
  5. 請求項1記載のスケーラブル符号化装置を具備する通信端末装置。
  6. 請求項1記載のスケーラブル符号化装置を具備する基地局装置。
  7. 狭帯域の復号量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化の逆量子化を行うスケーラブル復号装置であって、
    前記狭帯域の復号量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシス手段と、
    前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換手段と、
    前記プリエンファシスされたLSPパラメータを広帯域形態へ変換し、広帯域LSPパラメータを出力する変換手段と、
    前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類手段と、
    前記クラス情報を入力して多段ベクトル量子化の逆量子化を行う多段ベクトル量子化符号帳と、
    を備え、
    前記多段ベクトル量子化符号帳は、多段階の符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳から構成されており、前記クラス情報に対応するサブ符号帳を選択的に使用して前記逆量子化を行う、
    スケーラブル復号装置。
  8. 前記符号帳に格納されているコードベクトルの平均エネルギが最大となる段が初段である、
    請求項7記載のスケーラブル復号装置。
  9. 前記プリエンファシス手段は、
    入力したLPCパラメータにより構成されるLP合成フィルタのインパルス応答を算出し、
    プリエンファシスフィルタのインパルス応答を前記LP合成フィルタのインパルス応答に畳み込んでプリエンファシスされた前記LP合成フィルタのインパルス応答を算出し、
    前記プリエンファシスされたLP合成フィルタのインパルス応答の自己相関係数を算出し、
    算出した前記自己相関係数をLPCパラメータに変換することによって、LPCパラメータのプリエンファシス処理を行う、
    請求項7記載のスケーラブル復号装置。
  10. 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域LSPパラメータとの誤差が最小の前記コードベクトルを特定することによってクラス分類を行い、分類されたクラスを示すクラス情報を生成する、
    請求項7記載のスケーラブル復号装置。
  11. 請求項記載のスケーラブル復号装置を具備する通信端末装置。
  12. 請求項記載のスケーラブル復号装置を具備する基地局装置。
  13. 狭帯域の量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化を行うスケーラブル符号化方法であって、
    前記狭帯域の量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシスステップと、
    前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換ステップと、
    前記プリエンファシスされたLSPパラメータを広帯域形態に変換し、広帯域LSPパラメータを出力する変換ステップと、
    前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類ステップと、
    前記クラス情報を入力して多段ベクトル量子化を行う多段ベクトル量子化符号ステップと、
    を備え、
    前記多段ベクトル量子化符号ステップでは、多段ベクトル量子化符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳からなり、前記クラス情報に対応するサブ符号帳を選択的に使用して前記予測量子化を行う、
    スケーラブル符号化方法。
  14. 狭帯域の復号量子化LSPパラメータを用いて広帯域のLSPパラメータの予測量子化の逆量子化を行うスケーラブル復号方法であって、
    前記狭帯域の復号量子化LSPパラメータを変換して得られるLPCパラメータにプリエンファシス処理を行うプリエンファシスステップと、
    前記プリエンファシスされたLPCパラメータをプリエンファシスされたLSPパラメータに変換するLPC−LSP変換ステップと、
    前記プリエンファシスされたLSPパラメータを広帯域形態へ変換し、広帯域LSPパラメータを出力する変換ステップと、
    前記広帯域LSPパラメータを用いてクラス情報を生成するクラス分類ステップと、
    前記クラス情報を入力して多段ベクトル量子化の逆量子化を行う多段ベクトル量子化符号ステップと、
    を備え、
    前記多段ベクトル量子化符号ステップでは、多段ベクトル量子化符号帳のうち、符号帳に格納されているコードベクトルの平均エネルギが最大となる段の符号帳が複数のサブ符号帳からなり、前記クラス情報に対応するサブ符号帳を選択的に使用して前記逆量子化を行う、
    スケーラブル復号方法。
JP2006535201A 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法 Expired - Fee Related JP4963963B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006535201A JP4963963B2 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2004272481 2004-09-17
JP2004272481 2004-09-17
JP2004329094 2004-11-12
JP2004329094 2004-11-12
JP2005255242 2005-09-02
JP2005255242 2005-09-02
PCT/JP2005/017054 WO2006030865A1 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
JP2006535201A JP4963963B2 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010161735A Division JP5143193B2 (ja) 2004-09-17 2010-07-16 スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法

Publications (2)

Publication Number Publication Date
JPWO2006030865A1 JPWO2006030865A1 (ja) 2008-05-15
JP4963963B2 true JP4963963B2 (ja) 2012-06-27

Family

ID=36060115

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006535201A Expired - Fee Related JP4963963B2 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
JP2010161735A Expired - Fee Related JP5143193B2 (ja) 2004-09-17 2010-07-16 スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010161735A Expired - Fee Related JP5143193B2 (ja) 2004-09-17 2010-07-16 スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法

Country Status (8)

Country Link
US (2) US7848925B2 (ja)
EP (2) EP2273494A3 (ja)
JP (2) JP4963963B2 (ja)
KR (1) KR20070051910A (ja)
CN (2) CN101023471B (ja)
AT (1) ATE534990T1 (ja)
BR (1) BRPI0515453A (ja)
WO (1) WO2006030865A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
EP1933304A4 (en) * 2005-10-14 2011-03-16 Panasonic Corp DIMENSIONABLE CODING APPARATUS, DIMENSIONABLE DECODING APPARATUS AND METHODS OF USING SAME
EP1959431B1 (en) * 2005-11-30 2010-06-23 Panasonic Corporation Scalable coding apparatus and scalable coding method
WO2007119368A1 (ja) * 2006-03-17 2007-10-25 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US20100228553A1 (en) * 2007-09-21 2010-09-09 Panasonic Corporation Communication terminal device, communication system, and communication method
BRPI0818062A2 (pt) * 2007-10-12 2015-03-31 Panasonic Corp Quantizador vetorial, quantizador vetorial inverso, e métodos
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
US20100274556A1 (en) * 2008-01-16 2010-10-28 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
CN101911185B (zh) * 2008-01-16 2013-04-03 松下电器产业株式会社 矢量量化装置、矢量反量化装置及其方法
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
WO2010092827A1 (ja) 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US20130024191A1 (en) * 2010-04-12 2013-01-24 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
US8964966B2 (en) * 2010-09-15 2015-02-24 Avaya Inc. Multi-microphone system to support bandpass filtering for analog-to-digital conversions at different data rates
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5210368B2 (ja) 2010-10-29 2013-06-12 株式会社エヌ・ティ・ティ・ドコモ 無線基地局及び方法
US8818797B2 (en) 2010-12-23 2014-08-26 Microsoft Corporation Dual-band speech encoding
WO2012103686A1 (en) * 2011-02-01 2012-08-09 Huawei Technologies Co., Ltd. Method and apparatus for providing signal processing coefficients
FR2984580A1 (fr) * 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
PL3193332T3 (pl) * 2012-07-12 2020-12-14 Nokia Technologies Oy Kwantyzacja wektorowa
AU2014211520B2 (en) * 2013-01-29 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-frequency emphasis for LPC-based coding in frequency domain
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN107316647B (zh) 2013-07-04 2021-02-09 超清编解码有限公司 频域包络的矢量量化方法和装置
WO2015008783A1 (ja) * 2013-07-18 2015-01-22 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP3155774B1 (en) 2014-06-10 2018-08-08 Telefonaktiebolaget LM Ericsson (publ) Systems and methods for adaptively restricting csi reporting in multi antenna wireless communications systems utilizing unused bit resources
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
TWI583140B (zh) * 2016-01-29 2017-05-11 晨星半導體股份有限公司 具對數計算功能的解碼模組
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
KR20240033374A (ko) * 2022-09-05 2024-03-12 서울대학교산학협력단 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JPH08293932A (ja) * 1994-12-21 1996-11-05 At & T Corp 線形予測フィルター係数量子化器とフィルターセット
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2001053869A (ja) * 1999-08-13 2001-02-23 Oki Electric Ind Co Ltd 音声蓄積装置及び音声符号化装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
JPH05265496A (ja) * 1992-03-18 1993-10-15 Hitachi Ltd 複数のコードブックを有する音声符号化方法
JP2746039B2 (ja) 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JPH09127985A (ja) 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
DE19729494C2 (de) 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
ATE265732T1 (de) * 2000-05-22 2004-05-15 Texas Instruments Inc Vorrichtung und verfahren zur breitbandcodierung von sprachsignalen
EP1431962B1 (en) 2000-05-22 2006-04-05 Texas Instruments Incorporated Wideband speech coding system and method
JP3467469B2 (ja) 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
US20030004803A1 (en) * 2001-05-09 2003-01-02 Glover H. Eiland Method for providing securities rewards to customers
FI112424B (fi) * 2001-10-30 2003-11-28 Oplayo Oy Koodausmenetelmä ja -järjestely
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
KR100446630B1 (ko) * 2002-05-08 2004-09-04 삼성전자주식회사 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
US8024181B2 (en) * 2004-09-06 2011-09-20 Panasonic Corporation Scalable encoding device and scalable encoding method
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
EP1801783B1 (en) * 2004-09-30 2009-08-19 Panasonic Corporation Scalable encoding device, scalable decoding device, and method thereof
CN101729874B (zh) 2008-10-20 2013-06-19 清华大学 一种可分级视频传输处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08293932A (ja) * 1994-12-21 1996-11-05 At & T Corp 線形予測フィルター係数量子化器とフィルターセット
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2001053869A (ja) * 1999-08-13 2001-02-23 Oki Electric Ind Co Ltd 音声蓄積装置及び音声符号化装置

Also Published As

Publication number Publication date
CN101023471B (zh) 2011-05-25
CN101023471A (zh) 2007-08-22
EP2273494A3 (en) 2012-11-14
ATE534990T1 (de) 2011-12-15
JPWO2006030865A1 (ja) 2008-05-15
EP1791116A1 (en) 2007-05-30
US20080059166A1 (en) 2008-03-06
JP5143193B2 (ja) 2013-02-13
US8712767B2 (en) 2014-04-29
KR20070051910A (ko) 2007-05-18
BRPI0515453A (pt) 2008-07-22
CN102103860B (zh) 2013-05-08
JP2010244078A (ja) 2010-10-28
EP2273494A2 (en) 2011-01-12
EP1791116A4 (en) 2007-11-14
WO2006030865A1 (ja) 2006-03-23
US20110040558A1 (en) 2011-02-17
CN102103860A (zh) 2011-06-22
US7848925B2 (en) 2010-12-07
EP1791116B1 (en) 2011-11-23

Similar Documents

Publication Publication Date Title
JP4963963B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4977472B2 (ja) スケーラブル復号化装置
JP4989971B2 (ja) スケーラブル復号化装置および信号消失補償方法
JP5328368B2 (ja) 符号化装置、復号装置、およびこれらの方法
US8229749B2 (en) Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method
JP2006510947A (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
WO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JPWO2007105586A1 (ja) 符号化装置および符号化方法
RU2469421C2 (ru) Векторный квантователь, инверсный векторный квантователь и способы
JPWO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP6644848B2 (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
JP2008139447A (ja) 音声符号化装置及び音声復号装置
JP2007072264A (ja) 音声量子化方法、音声量子化装置、プログラム
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4293005B2 (ja) 音声音楽信号の符号化装置および復号装置
WO2012053146A1 (ja) 符号化装置及び符号化方法
JP2004274454A (ja) ディジタル信号パケット出力方法、その装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120327

R150 Certificate of patent or registration of utility model

Ref document number: 4963963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees