JP2005258478A - 符号化装置 - Google Patents

符号化装置 Download PDF

Info

Publication number
JP2005258478A
JP2005258478A JP2005166279A JP2005166279A JP2005258478A JP 2005258478 A JP2005258478 A JP 2005258478A JP 2005166279 A JP2005166279 A JP 2005166279A JP 2005166279 A JP2005166279 A JP 2005166279A JP 2005258478 A JP2005258478 A JP 2005258478A
Authority
JP
Japan
Prior art keywords
signal
encoding
enhancement layer
decoded
sampling rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005166279A
Other languages
English (en)
Other versions
JP4287840B2 (ja
JP2005258478A5 (ja
Inventor
Masahiro Oshikiri
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005166279A priority Critical patent/JP4287840B2/ja
Publication of JP2005258478A publication Critical patent/JP2005258478A/ja
Publication of JP2005258478A5 publication Critical patent/JP2005258478A5/ja
Application granted granted Critical
Publication of JP4287840B2 publication Critical patent/JP4287840B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 低ビットレートで高品質に符号化すること。
【解決手段】 ダウンサンプリング器101は、入力信号のサンプリングレートをサンプリングレートFHからサンプリングレートFLにダウンサンプリングする。基本レイヤ符号化器102は、サンプリングレートFLの音響信号を符号化する。局所復号化器103は、基本レイヤ符号化器102から出力された符号化コードを復号する。アップサンプリング器104は、復号信号のサンプリングレートをFHに上げる。減算器106は、サンプリングレートFHの音響信号から復号信号を減算する。拡張レイヤ符号化器107は、減算器106から出力された信号を局所復号化器103から出力された復号結果のパラメータを用いて符号化する。
【選択図】 図1

Description

本発明は、楽音信号または音声信号などの音響信号を高能率に圧縮符号化する符号化装置に関し、特に符号化コードの一部からでも楽音や音声を復号することができるスケーラブル符号化に好適な符号化装置に関する。
楽音信号または音声信号を低ビットレートで圧縮する音響符号化技術は、移動体通信における電波等の伝送路容量及び記録媒体の有効利用のために重要である。音声信号を符号化する音声符号化に、ITU(International Telecommunication Union)で規格化されているG726、G729などの方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を対象とし、8kbit/s〜32kbit/sのビットレートで高品質に符号化が行うことができる。
また、広帯域信号(50Hz〜7kHz)を対象とする標準方式としてITUのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR-WBなどが存在する。これらの方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号を高品質に符号化が行うことができる。
ここで、音声信号を低ビットレートで高能率に符号化を行う有効な方法に、CELP(Code Excited Linear Prediction)がある。CELPは、人間の音声生成モデルを工学的に模擬したモデルに基づき符号化を行う方法である。具体的には、CELPは、乱数で表される励振信号を周期性の強さに対応するピッチフィルタと声道特性に対応する合成フィルタに通し、その出力信号と入力信号の二乗誤差が聴覚特性の重み付けの下で最小になるよう符号化パラメータを決定する。
そして、最近の標準音声符号化方式の多くがCELPに基づいた符号化を行っている。例えば、G729は、8kbit/sで狭帯域信号の符号化を行うことができ、AMR-WBは6.6kbit/s〜23.85kbit/sで広帯域信号を符号化を行うことができる。
一方で、楽音信号を符号化する楽音符号化の場合は、MPEG(Moving Picture Expert Group)で規格化されているレイヤIII方式やAAC方式のように、楽音信号を周波数領域に変換し、聴覚心理モデルを利用して符号化を行う方法が一般的である。これら方式は、サンプリングレートが44.1kHzの信号に対しチャネル当たり64kbit/s〜96kbit/sでほとんど劣化が生じないことが知られている。
この楽音符号化は、音楽に対して高品質に符号化を行う方式である。楽音符号化は、前述の説明にある背景に音楽や環境音がある音声信号についても高品質に符号化を行うことができる。そして、対象となる信号の帯域もCD品質である22kHz程度まで対応可能である。
しかしながら、音声信号が主体で、背景に音楽や環境音が重畳している信号に音声符号化方式を用いて符号化する場合、背景部の音楽や環境音の影響で、背景部の信号のみならず音声信号も劣化してしまい全体的な品質が低下するという問題がある。
この問題は、音声符号化方式が、CELPという音声モデルに特化した方式を基本にしているために生じる。また、音声符号化方式が対応できる信号帯域は7kHzまでであり、それ以上の帯域の成分を持つ信号に対しては構成上十分に対応しきれないという問題があった。
また、楽音符号化方式では、高品質な符号化を実現するためにはビットレートを高くして使用する必要がある。楽音符号化方式では、仮にビットレートを32kbit/s程度まで低く抑えて符号化した場合、復号信号の品質が大きく低下するという問題がある。そのため、伝送レートの低い通信網で使用できないという問題がある。
本発明はかかる点に鑑みてなされたものであり、音声が主体で背景に音楽や環境音が重畳しているような信号であっても低ビットレートで高品質に符号化できる符号化装置を提供することを目的とする。
本発明の符号化装置は、入力信号のサンプリングレートを下げるダウンサンプリング手段と、サンプリングレートを下げた入力信号を符号化して第1符号化コードを得る基本レイヤ符号化手段と、前記第1符号化コードに基づいて復号信号を生成する復号化手段と、前記復号信号のサンプリングレートを前記入力信号と同一のレートに上げるアップサンプリング手段と、前記復号化手段の復号処理の中で生成されたパラメータを利用し、前記入力信号と前記サンプリングレートを上げた復号信号との差分値を符号化して第2符号化コードを得る拡張レイヤ符号化手段と、前記第1符号化コードと前記第2符号化コードとを多重する多重手段と、を具備し、前記拡張レイヤ符号化手段は、前記復号化手段の復号処理の中で生成されたピッチ周期およびピッチゲインを利用して符号化処理を行う構成を採る。
本発明によれば、低ビットレートで高品質に符号化を行うことができる。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る信号処理装置の構成を示すブロック図である。図1の信号処理装置100は、ダウンサンプリング器101と、基本レイヤ符号化器102と、局所復号化器103と、アップサンプリング器104と、遅延器105と、減算器106と、拡張レイヤ符号化器107と、マルチプレクサ108とから主に構成される。
ダウンサンプリング器101は、入力信号のサンプリングレートをサンプリングレートFHからサンプリングレートFLにダウンサンプリングし、サンプリングレートFLの音響信号を基本レイヤ符号化器102に出力する。ここで、サンプリングレートFLは、サンプリングレートFHより低い周波数である。
基本レイヤ符号化器102は、サンプリングレートFLの音響信号を符号化し、符号化コードを局所復号化器103とマルチプレクサ108に出力する。
局所復号化器103は、基本レイヤ符号化器102から出力された符号化コードを復号し、復号信号をアップサンプリング器104と拡張レイヤ符号化器107に出力する。
アップサンプリング器104は、復号信号のサンプリングレートをFHに上げて減算器106に出力する。
遅延器105は、入力されたサンプリングレートFHの音響信号を所定の時間の遅延した後、減算器106する。この遅延時間をダウンサンプリング器101と基本レイヤ符号化器102とアップサンプリング器104で生じる時間遅れと同値とすることにより、次の減算処理での位相のずれを防ぐ。
減算器106は、サンプリングレートFHの音響信号から復号信号を減算し、減算結果を拡張レイヤ符号化器107に出力する。
拡張レイヤ符号化器107は、減算器106から出力された信号を局所復号化器103から出力された復号結果のパラメータを用いて符号化し、マルチプレクサ108に出力する。マルチプレクサ108は、基本レイヤ符号化器102と拡張レイヤ符号化器107とにおいて符号化された信号を多重化して出力する。
次に、基本レイヤ符号化と拡張レイヤ符号化について説明する。図2は、入力信号の成分の一例を示す図である。図2において、縦軸は、信号の成分の情報量を示し、横軸は、周波数を示す。図2では、入力信号に含まれる音声情報と、背景音楽/背景雑音情報がどの周波数帯に存在しているかを表している。
音声情報は、周波数の低い領域に情報が多く存在し、高域に向かうほど情報量は減少する。それに対し、背景音楽・背景雑音情報は、音声情報と比べると相対的に低域の情報は少なく、高域に含まれる情報が大きい。
そこで、本発明の信号処理装置は、複数の符号化方式を用い、それぞれの符号化方式が適する領域毎に異なる符号化を行う。
図3は、本実施の形態に係る信号処理装置の信号処理方法の一例を示す図である。図3において、縦軸は、信号の成分の情報量を示し、横軸は、周波数を示す。
基本レイヤ符号化器102は、0〜FL間の周波数帯の音声情報を効率よく表すように設計されており、この領域での音声情報は品質良く符号化することができる。しかし、0〜FL間の周波数帯の背景音楽・背景雑音情報の符号化品質は高くない。拡張レイヤ符号化器107は、基本レイヤ符号化器102で符号化できない部分と、FL〜FH間の周波数帯の信号を符号化する。
よって、基本レイヤ符号化器102と拡張レイヤ符号化器107とを組み合わせることで広い帯域で高品質な符号化が実現できる。さらに、少なくとも基本レイヤ符号化手段の符号化コードだけでも音声情報が復号できるというスケーラブルな機能が実現できる。
このように、局所復号化器103における符号化で生成されたパラメータのうち有用なものを拡張レイヤ符号化器107に与え、拡張レイヤ符号化器107は、このパラメータを利用して符号化を行う。
このパラメータは符号化コードから生成されるため、本実施の形態の信号処理装置により符号化された信号を復号する場合に、音響復号化の過程で同じパラメータを得ることができ、このパラメータを付加して復号側に伝送する必要がない。このために、拡張レイヤ符号化手段は付加情報の増加を伴うことなしに、符号化処理の効率化を図ることができる。
例えば、局所復号化器103において復号されるパラメータのうち、拡張レイヤ符号化器107で用いられるパラメータとして、入力信号が母音のように周期性の強い信号か子音のように雑音性の強い信号かを表す有声/無声フラグを使う構成がある。有声/無声フラグを用い、有声である区間において拡張レイヤでは高域よりも低域を重視してビット配分を行い、無声である区間では低域よりも高域を重視してビット配分を行う、などの適応化を図ることができる。
このように、本実施の形態の信号処理装置によれば、入力信号から所定の周波数以下の成分を取り出して音声符号化に適した符号化を行い、得られた符号化コードを復号した結果を用いて楽音符号化に適した符号化を行うことにより、低ビットレートで高品質に符号化を行うことができる。
また、サンプリングレートFHとFLには、FHがFLより大きい値であれば良く、値は限定されない。例えば、サンプリングレートをFH=24kHz、FL=16kHzとし、符号化することができる。
(実施の形態2)
本実施の形態では、実施の形態1の局所復号化器103で復号されるパラメータのうち、拡張レイヤ符号化器107で用いられるパラメータとして、入力信号のスペクトルを表すLPC係数を用いる例について説明する。
本実施の形態の信号処理装置は、図1の基本レイヤ符号化器102においてCELPを用いた符号化を行い、拡張レイヤ符号化器107において入力信号のスペクトルを表すLPC係数を用いて符号化を行う。
ここでは最初に、基本レイヤ符号化器102の詳細な動作の説明を行った後に、拡張レイヤ符号化器107の基本構成の説明を行う。ここでいう基本構成とは、今後の実施の形態の説明を簡便にするためのもので、局所復号化器103の符号化パラメータを用いない構成を指す。その後に本実施の形態の特徴である局所復号化器103でLPC係数を復号し、このLPC係数を用いた拡張レイヤ符号化器107の説明を行う。
図4は、基本レイヤ符号化器102の構成の一例を示す図である。図4の基本レイヤ符号化器102は、LPC分析器401と、聴感重み付け部402と、適応符号帳探索器403と、適応ゲイン量子化器404と、目標ベクトル生成器405と、雑音符号帳探索器406と、雑音ゲイン量子化器407と、マルチプレクサ408とから主に構成される。
LPC分析器401は、ダウンサンプリング器101においてサンプリングレートFLでサンプリングされた入力信号からLPC係数を求め、聴感重み付け部402に出力する。
聴感重み付け部402は、LPC分析器401で求められたLPC係数を基に入力信号に重み付けを行い、重み付けされた入力信号を適応符号帳探索器403、適応ゲイン量子化器404、及び目標ベクトル生成器405に出力する。
適応符号帳探索器403は、聴覚重み付けされた入力信号を目標信号として適応符号帳の探索を行い、探索した適応ベクトルを適応ゲイン量子化器404と目標ベクトル生成器405に出力する。そして、適応符号帳探索器403は、量子化歪みが最も少ないとされた適応ベクトルのコードをマルチプレクサ408に出力する。
適応ゲイン量子化器404は、適応符号帳探索器403から出力される適応ベクトルに乗算する適応ゲインを量子化し、目標ベクトル生成器405に出力する。そして、そのコードをマルチプレクサ408に出力する。
目標ベクトル生成器405は、聴感重み付け部402から出力された入力信号を適応ベクトルに適応ゲインを乗算した結果でベクトル減算し、減算結果を目標ベクトルとして雑音符号帳探索器406と雑音ゲイン量子化器407に出力する。
雑音符号帳探索器406は、目標ベクトル生成器405から出力された目標ベクトルとの歪が最小となる雑音ベクトルを雑音符号帳の中から探索する。そして、雑音符号帳探索器406は、探索した雑音ベクトルを雑音ゲイン量子化器407に与えるとともに、そのコードをマルチプレクサ408に出力する。
雑音ゲイン量子化器407は、雑音符号帳探索器406において探索された雑音ベクトルに乗算する雑音ゲインを量子化し、そのコードをマルチプレクサ408に出力する。
マルチプレクサ408は、LPC係数、適応ベクトル、適応ゲイン、雑音ベクトル、雑音ゲインの符号化コードを多重化して局所復号化器103及びマルチプレクサ108に出力する。
次に、図4の基本レイヤ符号化器102の動作について説明する。最初に、ダウンサンプリング器101から出力されたサンプリングレートFLの信号が入力され、LPC分析器401においてLPC係数が求められる。このLPC係数は、LSP係数などの量子化に適したパラメータに変換され、量子化される。この量子化で得られる符号化コードがマルチプレクサ408に与えられ、かつ符号化コードから量子化後のLSP係数が算出されLPC係数に変換される。
この変換により、量子化後のLPC係数が求められる。この量子化後のLPC係数を利用して、適応符号帳、適応ゲイン、雑音符号帳および雑音ゲインの符号化を行う。
次に、聴感重み付け部402は、LPC分析器401で求められたLPC係数に基づいて入力信号に重み付けを行う。この重み付けは、量子化歪のスペクトルを入力信号のスペクトル包絡にマスクされるようスペクトル整形を行うことを目的として成される。
次に、聴覚重み付けされた入力信号を目標信号とし、適応符号帳探索器403において適応符号帳が探索される。過去の音源系列をピッチ周期で繰り返した信号を適応ベクトルと呼び、あらかじめ定められた範囲のピッチ周期で生成された適応ベクトルによって適応符号帳は構成される。
聴覚重み付けされた入力信号をt(n)、ピッチ周期iの適応ベクトルにLPC係数で構成される合成フィルタのインパルス応答を畳み込んだ信号をpi(n)としたとき、次の式(1)の評価関数Dを最小とする適応ベクトルのピッチ周期iがパラメータとしてマルチプレクサ408に送られる。ここで、Nはベクトル長を示す。
Figure 2005258478
次に、適応ベクトルに乗じられる適応ゲインの量子化を適応ゲイン量子化器404において行う。適応ゲインβは次の式(2)で表され、このβをスカラー量子化して、その符号がマルチプレクサ408に送られる。
Figure 2005258478
次に、目標ベクトル生成器405において入力信号から適応ベクトルの影響を減算して、雑音符号帳探索器406と雑音ゲイン量子化器407で用いる目標ベクトルを生成する。ここで、pi(n)を式1で表される評価関数Dを最小とするときの適応ベクトルに合成フィルタを畳み込んだ信号、βqを式2で表される適応ベクトルβをスカラー量子化したときの量子化値としたとき、目標ベクトルt2(n)は次の式(3)に表される。
Figure 2005258478
前記目標ベクトルt2(n)とLPC係数が、雑音符号帳探索器406に与えられ、雑音符号帳の探索が行われる。
ここで、雑音符号帳探索器406が備える雑音符号帳の代表的な構成に代数(Algebraic)符号帳がある。代数符号帳とは、振幅1のパルスをあらかじめ定められた非常に少ない数だけ有するベクトルで表される。さらに、代数符号帳は、パルスごとにとりうる位置は重複することなくあらかじめ決められている。そして、代数符号帳は、パルスの位置とパルスの符号(極性)の最適な組み合わせを少ない計算量で決定することができるという特徴がある。
目標ベクトルをt2(n)、コードjに対応する雑音ベクトルをcj(n)としたとき、次の式(4)の評価関数Dを最小とする雑音ベクトルのインデックスjがパラメータとしてマルチプレクサ408に送られる。
Figure 2005258478
次に、雑音ベクトルに乗じられる雑音ゲインの量子化を雑音ゲイン量子化器407において行う。雑音ゲインγは次の式(5)で表され、このγをスカラー量子化して、その符号がマルチプレクサ408に送られる。
Figure 2005258478
マルチプレクサ408は、送られてきたLPC係数、適応符号帳、適応ゲイン、雑音符号帳、雑音ゲインの符号化コードを多重化して局所復号化器103及びマルチプレクサ108に出力する。
そして、新しい入力信号が存在する間、上記処理を繰り返す。新しい入力信号が存在しない場合には、処理を終了する。
次に、拡張レイヤ符号化器107について説明する。図5は、拡張レイヤ符号化器107の構成の一例を示す図である。図5の拡張レイヤ符号化器107は、LPC分析器501と、スペクトル包絡算出器502と、MDCT部503と、パワー算出器504と、パワー正規化器505と、スペクトル正規化器506と、Barkスケール正規化器508と、Barkスケール形状算出器507と、ベクトル量子化器509と、マルチプレクサ510とから主に構成される。
LPC分析器501は、入力信号にLPC分析を行い、得られたLPC分析係数をスペクトル包絡算出器502及びマルチプレクサ510に出力する。スペクトル包絡算出器502は、LPC係数からスペクトル包絡を算出してベクトル量子化器509に出力する。
MDCT部503は、入力信号にMDCT変換(Modified Discrete Cosine Transform:変形離散コサイン変換)を行い、得られたMDCT係数をパワー算出器504及びパワー正規化器505に出力する。パワー算出器504は、MDCT係数のパワーを求め、量子化した後、パワー正規化器505及びマルチプレクサ510に出力する。
パワー正規化器505は、量子化後のパワーにてMDCT係数を正規化し、正規化後のパワーをスペクトル正規化器506に出力する。スペクトル正規化器506は、スペクトル包絡を用いてパワーにより正規化されたMDCT係数を正規化し、Barkスケール形状算出器507及びBarkスケール正規化器508に出力する。
Barkスケール形状算出器507は、Barkスケールにて等間隔に帯域分割されたスペクトルの形状を算出した後に、前記スペクトル形状を量子化し、量子化したスペクトル形状をBarkスケール正規化器508、ベクトル量子化器509、及びマルチプレクサ510に出力する。
Barkスケール正規化器508は、各帯域のBarkスケール形状B(k)を量子化し、その符号化コードをマルチプレクサ510に出力する。そして、Barkスケール正規化器508は、Barkスケール形状を復号化して正規化MDCT係数を生成し、ベクトル量子化器509に出力する。
ベクトル量子化器509は、Barkスケール正規化器508から出力された正規化MDCT係数をベクトル量子化し、最も歪が小さい代表値を求め、このインデックスを符号化コードとしてマルチプレクサ510に出力する。
マルチプレクサ510は、符号化コードを多重化して、マルチプレクサ108に出力する。
次に、図5の拡張レイヤ符号化器107の動作について説明する。図1の減算器106で得られる減算信号が、LPC分析器501においてLPC分析される。そして、LPC分析によりLPC係数が算出される。このLPC係数をLSP係数などの量子化に適したパラメータに変換した後に量子化を行う。ここで得られたLPC係数に関する符号化コードはマルチプレクサ510に与えられる。
スペクトル包絡算出器502では、復号されたLPC係数を基に、次の式(6)に従いスペクトル包絡を算出する。ここでαは、復号されたLPC係数をしめし、NPはLPC係数の次数、Mはスペクトル分解能を示す。
Figure 2005258478
式(6)により得られたスペクトル包絡env(m)は、後に説明するスペクトル正規化器506およびベクトル量子化器509で利用される。
次に、入力信号は、MDCT部503においてMDCT変換が行われ、MDCT係数が求められる。MDCT変換は、前後の隣接フレームと分析フレームを半分ずつ完全に重ね合わせ、かつ分析フレームの前半部は奇関数、後半部は偶関数という直交基底を用いるため、フレーム境界歪が発生しないという特徴がある。MDCTを行う際には、sin窓などの窓関数を入力信号に乗ずる。MDCT係数をX(m)とすると、MDCT係数は次の式(7)に従い算出される。ここでx(n)は、入力信号に窓関数を乗算した信号を示す。
Figure 2005258478
次に、パワー算出器504では、MDCT係数X(m)のパワーを求め量子化する。そして、パワー正規化器505が、式(8)を用い、当該量子化後のパワーにてMDCT係数を正規化する。ここで、MはMDCT係数の次数を示す。
Figure 2005258478
MDCT係数のパワーpowを量子化した後に、この符号化コードをマルチプレクサ510に送る。符号化コードを使ってMDCT係数のパワーを復号した後に、その値を用いてMDCT係数を次の式(9)に従い正規化する。ここで、X1(m)はパワー正規化後のMDCT係数を表し、powqは量子化後のMDCT係数のパワーを示す。
Figure 2005258478
次に、スペクトル正規化器506は、スペクトル包絡を用いてパワーにより正規化されたMDCT係数を正規化する。スペクトル正規化器506では次の式(10)に従い正規化を行う。
Figure 2005258478
次に、Barkスケール形状算出器507は、Barkスケールにて等間隔に帯域分割されたスペクトルの形状を算出した後に、前記スペクトル形状を量子化する。Barkスケール形状算出器507は、この符号化コードをマルチプレクサ510に送ると共にその復号値を用いてスペクトル正規化器506の出力信号であるMDCT係数X2(m)の正規化を行う。BarkスケールとHerzスケールは次の式(11)で表される変換式にて対応付けされる。ここでBはBarkスケールを、fはHerzスケールを示す。
Figure 2005258478
Barkスケール形状算出器507は、Barkスケールで等間隔に帯域分割されたサブバンドそれぞれに対し、次の式(12)に従い形状を算出する。ここでfl(k)は第kサブバンドの最低周波数、fh(k)は第kサブバンドの最高周波数を示し、Kはサブバンド数を示す。
Figure 2005258478
そして、Barkスケール正規化器508は、各帯域のBarkスケール形状B(k)を量子化し、その符号化コードをマルチプレクサ510に送ると共に、Barkスケール形状を復号化して正規化MDCT係数X3(m)を次の式(13)に従い生成する。ここでBq(k)は第kサブバンドの量子化後のBarkスケール形状を示す。
Figure 2005258478
次に、ベクトル量子化器509では、Barkスケール正規化器508の出力X3(m)のベクトル量子化を行う。ベクトル量子化器509では、X3(m)を複数ベクトルに分割して各ベクトルに対応する符号帳を用いて最も歪が小さい代表値を求め、このインデックスを符号化コードとしてマルチプレクサ510に送る。
ベクトル量子化器509では、ベクトル量子化を行う際に2つの重要なパラメータを入力信号のスペクトル情報を用いて決定する。そのパラメータとは、1つは量子化ビット配分であり、もう一つは符号帳探索時の重み付けである。量子化ビット配分は、スペクトル包絡算出器502で求められたスペクトル包絡env(m)を用いて決定する。
また、スペクトル包絡env(m)を用いて量子化ビット配分を決定する際に、周波数0〜FLに相当するスペクトルに配分するビット数を小さくするように設定することもできる。
その一つの実現例として、周波数0〜FLに配分できる最大ビット数MAX_LOWBAND_BITを設定し、この帯域に配分されるビット数が最大ビット数MAX_LOWBAND_BITを超えないように制限を設ける方法がある。
この実現例では、周波数0〜FLでは基本レイヤで符号化を既に行っているので、多くのビットを配分する必要がなく、この帯域での量子化を故意に粗くして、ビット配分を少なくし、そこで余分になるビットを周波数FL〜FHに配分して量子化することにより全体的な品質を改善することができる。また、このビット配分は、スペクトル包絡env(m)と前述したBarkスケール形状Bq(k)とを組み合わせて決定する構成としても良い。
また、スペクトル包絡算出器502で求められたスペクトル包絡env(m)とBarkスケール形状算出器507で求められた量子化後のBarkスケール形状Bq(k)から算出される重み付けを利用した歪尺度を用いてベクトル量子化を行う。ベクトル量子化は次の式(14)で規定される歪Dが最小となるコードベクトルCのインデックスjを求めることで実現される。 ここで、w(m)は重み係数を示す。
Figure 2005258478
また、重み関数w(m)はスペクトル包絡env(m)とBarkスケール形状Bq(k)を用いて次の式(15)のように表すことができる。ここでpは0から1の間の定数、Herz_to_Bark()はHerzスケールをBarkスケールに変換する関数を示す。
Figure 2005258478
また、重み関数w(m)を決定する際に、周波数0〜FLに相当するスペクトルに配分する重み関数を小さくするように設定することも可能である。その一つの実現例として、周波数0〜FLに対応する重み関数w(m)のとりうる最大値をMAX_LOWBAND_WGTとしてあらかじめ設定しておき、この帯域の重み関数w(m)の値がMAX_LOWBAND_WGTを超えないように制限を設ける方法がある。この実現例では、周波数0〜FLでは基本レイヤで符号化を既に行っており、この帯域での量子化の精度を故意に下げて、相対的に周波数FL〜FHの量子化の精度を上げることにより全体的な品質を改善することができる。
最後に、マルチプレクサ510では、符号化コードを多重化して、マルチプレクサ108に出力する。そして、新しい入力信号が存在する間、上記処理を繰り返す。新しい入力信号が存在しない場合には、処理を終了する。
このように、本実施の形態の信号処理装置によれば、入力信号から所定の周波数以下の成分を取り出して符号励振線形予測法を用いた符号化を行い、得られた符号化コードを復号した結果を用いてMDCT変換で符号化を行うことにより、低ビットレートで高品質に符号化を行うことができる。
上記では、減算器106で得られる減算信号からLPC分析係数を分析している例について説明しているが、本発明の信号処理装置は、局所復号化器103において復号されたLPC係数を用いて符号化してもよい。
図6は、拡張レイヤ符号化器107の構成の一例を示す図である。但し、図5と同一の構成となるものについては、図5と同一番号を付し、詳しい説明を省略する。
図6の拡張レイヤ符号化器107は、変換テーブル601と、LPC係数マッピング部602と、スペクトル包絡算出器603と、変形部604とを具備し、局所復号化器103で復号されたLPC係数を用いて符号化する点が図5の拡張レイヤ符号化器107と異なる。
変換テーブル601は、基本レイヤのLPC係数と拡張レイヤのLPC係数とを対応づけて記憶する。
LPC係数マッピング部602は、変換テーブル601を参照し、基本レイヤ符号化器102から入力された基本レイヤのLPC係数を拡張レイヤのLPC係数に変換し、スペクトル包絡算出器603に出力する。
スペクトル包絡算出器603は、拡張レイヤのLPC係数に基づいてスペクトル包絡を求め、変形部604に出力する。変形部604は、スペクトル包絡を変形し、スペクトル正規化器506及びベクトル量子化器509に出力する。
次に、図6の拡張レイヤ符号化器107の動作について説明する。基本レイヤのLPC係数は、信号帯域が0〜FLの信号に対して求められたものであり、拡張レイヤの対象となる信号(信号帯域0〜FH)で使用するLPC係数とは一致しない。しかしながら、両者には強い相関がある。よってLPC係数マッピング部602では、この相関を利用してあらかじめ信号帯域0〜FLの信号用のLPC係数と信号帯域0〜FHの信号用のLPC係数との対応付けを表す変換テーブル601を別途設計しておく。この変換テーブル601を用いて、基本レイヤのLPC係数から拡張レイヤのLPC係数を求める。
図7は、拡張LPC係数算出の一例を示す図である。変換テーブル601は、拡張レイヤのLPC係数(次数M)を表すJ個の候補{Yj(m)}と、{Yj(m)}と対応付けられた基本レイヤのLPC係数と同じ次数(=K)をもつ候補{yj(k)}より構成される。{Yj(m)}と{yj{k}}は大規模な楽音、音声データなどからあらかじめ設計して用意しておく。基本レイヤのLPC係数x(k)が入力されてきたとき、{yj(k)}の中からx(k)に最も類似しているLPC係数を求める。最も類似していると判定されたLPC係数のインデックスjに対応する拡張レイヤのLPC係数Yj(m)を出力することにより、基本レイヤのLPC係数から拡張レイヤのLPC係数のマッピングを実現することができる。
次に、このようにしてもとめた拡張レイヤのLPC係数を基に、スペクトル包絡算出器603においてスペクトル包絡を求める。そして、このスペクトル包絡を変形部604において変形する。そして、この変形スペクトル包絡を前述した実施例のスペクトル包絡とみなして処理を行う。
スペクトル包絡を変形する変形部604の一つの実現例として、基本レイヤの符号化の対象となる信号帯域0〜FLに対応するスペクトル包絡の影響を小さくする処理がある。スペクトル包絡をenv(m)としたとき、変形後のスペクトル包絡env’(m)は、以下の式(16)で表される。ここでpは0〜1の間の定数を示す。
Figure 2005258478
周波数0〜FLでは基本レイヤで符号化を既に行っており、拡張レイヤの符号化対象である減算信号の周波数0〜FLのスペクトルはフラットに近くなる。それにも関わらず、本実施例で説明したようなLPC係数のマッピングではこのような作用は考慮されていない。そこで、式(16)を用いてスペクトル包絡を修正する手法を用いることにより品質改善を図ることができる。
このように、本実施の形態の信号処理装置によれば、基本レイヤ符号化器で量子化したLPC係数を用いて拡張レイヤのLPC係数を求め、拡張レイヤのLPC分析からスペクトル包絡を算出することより、LPC分析および量子化の必要がなくなり、量子化ビット数を削減することができる。
(実施の形態3)
図8は、本発明の実施の形態3に係る信号処理装置の拡張レイヤ符号化器の構成を示すブロック図である。但し、図5と同一の構成となるものについては、図5と同一番号を付し、詳しい説明を省略する。
図8の拡張レイヤ符号化器107は、スペクトル微細構造算出器801を具備し、基本レイヤ符号化器102で符号化され局所復号化器103で復号されたピッチ周期を用いてスペクトル微細構造を算出し、当該スペクトル微細構造をスペクトルの正規化およびベクトル量子化に活用する点が図5の拡張レイヤ符号化器と異なる。
スペクトル微細構造算出器801は、基本レイヤで符号化されたピッチ周期Tとピッチゲインβからスペクトル微細構造を算出し、スペクトル正規化器506に出力する。
具体的には、これらピッチ周期Tとピッチゲインβは符号化コードの一部であり、ここでは図示されない音響復号器において同じ情報を得ることができる。よって、ピッチ周期Tとピッチゲインβを利用して符号化を行ったとしてもビットレートが増加することはない。
スペクトル微細構造算出器801では、ピッチ周期Tとピッチゲインβを用いて次の式(17)に従いスペクトル微細構造har(m)を算出する。ここでMはスペクトル分解能を示す。
Figure 2005258478
式(17)は、βの絶対値が1以上となる場合に発振フィルタとなるため、βの絶対値がとりうる範囲をあらかじめ定められた1未満の設定値(例えば0.8)以下になるよう制限を設ける方法もある。
スペクトル正規化器506では、スペクトル包絡算出器502で求められるスペクトル包絡env(m)と、スペクトル微細構造算出器801で求められるスペクトル微細構造har(m)の両者を用いて次の式(18)に従い正規化を行う。
Figure 2005258478
また、ベクトル量子化器509での量子化ビットの配分は、スペクトル包絡算出器502で求められるスペクトル包絡env(m)とスペクトル微細構造算出器801で求められるスペクトル微細構造har(m)の両者を用いて決定する。また、ベクトル量子化の際の重み関数w(m)の決定に、スペクトル微細構造をも利用する。具体的には、重み関数w(m)は次の式(19)に従い定義される。ここでpは0から1の間の定数、Herz_to_Bark()はHerzスケールをBarkスケールに変換する関数を示す。
Figure 2005258478
このように、本実施の形態の信号処理装置は、基本レイヤ符号化器で符号化され局所復号化器で復号されたピッチ周期を用いてスペクトル微細構造を算出し、当該スペクトル微細構造をスペクトルの正規化およびベクトル量子化に活用することにより、量子化性能を向上することができる。
(実施の形態4)
図9は、本発明の実施の形態4に係る信号処理装置の拡張レイヤ符号化器の構成を示すブロック図である。但し、図5と同一の構成となるものについては、図5と同一番号を付し、詳しい説明を省略する。
図9の拡張レイヤ符号化器107は、パワー推定器901と、パワー変動量量子化器902とを具備し、基本レイヤ符号化器102により得られる符号化コードを用いて局所復号化器103において復号信号を生成し、当該復号信号を利用基本レイヤの復号信号からMDCT係数のパワーを予測し、その予測値からの変化量を符号化する点が図5の拡張レイヤ符号化器と異なる。
図5における局所復号化器103において復号化された信号sl(n)が、パワー推定器901に入力される。そして、パワー推定器901では、前記復号信号sl(n)からMDCT係数のパワーを推定する。MDCT係数のパワーの推定値をpowpとすると、powpは次の式(20)のように表される。ここで、Nは復号信号sl(n)の長さ、αはあらかじめ定められた補正のための定数を示す。
Figure 2005258478
また、基本レイヤのLPC係数から求められるスペクトル傾きを利用した別の方法では、MDCT係数のパワーの推定値は次の式(21)にて表される。
Figure 2005258478
ここでβは、基本レイヤのLPC係数から求められるスペクトル傾きに依存した変数を表し、スペクトル傾きが大きい(相対的に低域にパワーがある)場合にβはゼロに近づき、スペクトル傾きが小さい (相対的に高域にパワーがある)場合にβは1に近づく性質を持つ。
次に、パワー変動量量子化器902では、MCDT部503で求めたMDCT係数のパワーをパワー推定器901で求めたパワー推定値powpにて正規化し、その変動量を量子化する。変動量rは次の式(22)で表される。
Figure 2005258478
ここでpowはMDCT係数のパワーを示し、式(23)にて算出される。ここでX(m)はMDCT係数、Mはフレーム長を示す。
Figure 2005258478
パワー変動量量子化器902では、変動量rを量子化し、その符号化コードをマルチプレクサ510に送ると共に、量子化後の変動量rqを復号する。パワー正規化器505では、量子化後の変動量rqを用いてMDCT係数を次の式(24)を用いて正規化する。ここで、X1(m)はパワー正規化後のMDCT係数を示す。
Figure 2005258478
このように、本実施の形態の信号処理装置は、基本レイヤの復号信号のパワーと拡張レイヤのMDCT係数のパワーとの間の相関を利用し、基本レイヤの復号信号を利用してMDCT係数のパワーを予測し、その予測値からの変動量を符号化することにより、MDCT係数のパワーの量子化に必要なビット数を削減することができる。
(実施の形態5)
図10は、本発明の実施の形態5に係る信号処理装置の構成を示すブロック図である。図10の信号処理装置1000は、デマルチプレクサ1001と、基本レイヤ復号化器1002と、アップサンプリング器1003と、拡張レイヤ復号化器1004と、加算器1005とから主に構成される。
デマルチプレクサ1001は、符号化されたコードを分離して基本レイヤ用の符号化コードと拡張レイヤ用の符号化コードを生成する。そして、デマルチプレクサ1001は、基本レイヤ用の符号化コードを基本レイヤ復号化器1002に出力し、拡張レイヤ用の符号化コードを拡張レイヤ復号化器1004に出力する。
基本レイヤ復号化器1002は、デマルチプレクサ1001で得られた基本レイヤ用の符号化コードを用いてサンプリングレートFLの復号信号を復号し、アップサンプリング器1003に出力する。同時に、基本レイヤ復号化器1002で復号されたパラメータを拡張レイヤ復号化器1004に出力する。アップサンプリング器1003は、復号信号のサンプリング周波数をFHに上げ、加算器1005に出力する。
拡張レイヤ復号化器1004は、デマルチプレクサ1001で得られた拡張レイヤ用の符号化コードと基本レイヤ復号化器1002において復号されたパラメータを用いてサンプリングレートFHの復号信号を復号し、加算器1005に出力する。
加算器1005は、アップサンプリング器1003から出力された復号信号と、拡張レイヤ復号化器1004から出力された復号信号をベクトル加算する。
次に、本実施の形態の信号処理装置の動作について説明する。最初に、実施の形態1から4のいずれかの信号処理装置において符号化されたコードが入力され、デマルチプレクサ1001において前記コードを分離して基本レイヤ用の符号化コードと拡張レイヤ用の符号化コードを生成する。
次に、基本レイヤ復号化器1002では、デマルチプレクサ1001で得られた基本レイヤ用の符号化コードを用いてサンプリングレートFLの復号信号を復号する。そして、アップサンプリング器1003は、当該復号信号をサンプリング周波数をFHに上げる。
拡張レイヤ復号化器1004では、デマルチプレクサ1001で得られた拡張レイヤ用の符号化コードと基本レイヤ復号化器1002において復号されたパラメータを用いてサンプリングレートFHの復号信号が復号される。
前記アップサンプリング器1003においてアップサンプリングされた基本レイヤの復号信号と当該拡張レイヤの復号信号とを加算器1005において加算する。そして、新しい入力信号が存在する間、上記処理を繰り返す。新しい入力信号が存在しない場合には、処理を終了する。
このように、本実施の形態の信号処理装置は、基本レイヤ復号化器1002で復号されたパラメータを用いて拡張レイヤ復号化器1004の復号を行うことにより、基本レイヤ符号化における復号パラメータを使って拡張レイヤの符号化を行う音響符号化手段の符号化コードから復号信号を生成することができる。
次に、基本レイヤ復号化器1002について説明する。図11は、基本レイヤ復号化器1002の一例を示すブロック図である。図11の基本レイヤ復号化器1002は、デマルチプレクサ1101と、音源生成器1102と、合成フィルタ1103とから主に構成され、CELPの復号化処理を行う。
デマルチプレクサ1101は、デマルチプレクサ1001から出力された基本レイヤ用の符号化コードから各種パラメータを分離し、音源生成器1102及び合成フィルタ1103に出力する。
音源生成器1102は、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインを復号し、これらを用いて音源信号を生成し合成フィルタ1103に出力する。合成フィルタ1103は、復号されたLPC係数を用いて合成信号を生成する。
次に、図11の基本レイヤ復号化器1002の動作について説明する。最初に、デマルチプレクサ1101は、基本レイヤ用の符号化コードから、各種パラメータを分離する。
次に、音源生成器1102が、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインを復号する。そして、音源生成器1102は、次の式(25)に従い音源ベクトルex(n)を生成する。ここで、q(n)は適応ベクトル、βqは適応ベクトルゲイン、c(n)は雑音ベクトル、γqは雑音ベクトルゲインを示す。
Figure 2005258478
次に、合成フィルタ1103が、復号されたLPC係数を用いて合成信号syn(n)を次の式(26)に従い生成する。ここで、αqは復号されたLPC係数、NPはLPC係数の次数を示す。
Figure 2005258478
このように復号された復号信号syn(n)は、アップサンプリング器1003及び拡張レイヤ復号化器1004に出力される。そして、新しい入力信号が存在する間、上記処理を繰り返す。新しい入力信号が存在しない場合には、処理を終了する。CELPの構成によっては、合成信号をポストフィルタに通した後に出力する形態もありうる。ここでいうポストフィルタとは、符号化歪を知覚しにくくする後処理の機能を有するものである。
次に、拡張レイヤ復号化器1004について説明する。図12は、拡張レイヤ復号化器1004の一例を示すブロック図である。図12の拡張レイヤ復号化器1004は、デマルチプレクサ1201と、LPC係数復号化器1202と、スペクトル包絡算出器1203と、ベクトル復号化器1204と、Barkスケール形状復号化器1205と、乗算器1206と、乗算器1207と、パワー復号化器1208と、乗算器1209と、IMDCT部1210とから主に構成される。
デマルチプレクサ1201は、デマルチプレクサ1001から出力された拡張レイヤ用の符号化コードから各種パラメータを分離する。LPC係数復号化器1202は、LPC係数に関する符号化コードを用いてLPC係数を復号し、スペクトル包絡算出器1203に出力する。
スペクトル包絡算出器1203は、復号されたLPC係数を用いて式(6)に従いスペクトル包絡env(m)を算出し、ベクトル復号化器1204及び乗算器1207に出力する。
ベクトル復号化器1204は、スペクトル包絡算出器1203において求められたスペクトル包絡env(m)に基づいて量子化ビット配分を決定し、デマルチプレクサ1201から得られる符号化コードと前記量子化ビット配分とから正規化MDCT係数X3q(m)を復号する。なお、量子化ビット配分の方法は、実施の形態1から実施の形態4のいずれかの符号化法において拡張レイヤ符号化で用いたものと同じ方法とする。
Barkスケール形状復号化器1205は、デマルチプレクサ1201より得られる符号化コードを元にBarkスケール形状Bq(k)を復号し、乗算器1206に出力する。
乗算器1206は、次の式(27)に従い、正規化MDCT係数X3q(m)とBarkスケール形状Bq(k)を乗算し、乗算結果を乗算器1207に出力する。ここでfl(k)は第kサブバンドの最低周波数、fh(k)は第kサブバンドの最高周波数を表し、Kはサブバンド数を示す。
Figure 2005258478
乗算器1207は、次の式(28)に従い、乗算器1206より得られる正規化MDCT係数X2(m)とスペクトル包絡算出器1203において求められたスペクトル包絡env(m)を乗算し、乗算結果を乗算器1209に出力する。
Figure 2005258478
パワー復号化器1208は、デマルチプレクサ1201より得られる符号化コードを元にパワーpowqを復号し、復号結果を乗算器1209に出力する。
乗算器1209は、次の式(29)に従い、正規化MDCT係数X1(m)と復号パワーpowqを乗算し、乗算結果をIMDCT部1210に出力する。
Figure 2005258478
IMDCT部1210は、このようにして求められた復号MDCT係数にIMDCT変換(Modified Discrete Cosine Transform:逆修正コサイン変換)を施し、前フレームで復号された信号と分析フレームの半分だけオーバーラップさせて加算して出力信号を生成し、この出力信号を加算器1005に出力する。そして、新しい入力信号が存在する間、上記処理を繰り返す。新しい入力信号が存在しない場合には、処理を終了する。
このように、本実施の形態の信号処理装置によれば、基本レイヤ復号化器で復号されたパラメータを用いて拡張レイヤ復号化器の復号を行うことにより、基本レイヤ符号化における復号パラメータを使って拡張レイヤの符号化を行う音響符号化手段の符号化コードから復号信号を生成することができる。
(実施の形態6)
図13は、拡張レイヤ復号化器1004の構成の一例を示す図である。但し、図12と同一の構成となるものについては、図12と同一番号を付し、詳しい説明を省略する。
図13の拡張レイヤ復号化器1004は、変換テーブル1301と、LPC係数マッピング部1302と、スペクトル包絡算出器1303と、変形部1304とを具備し、局所復号化器103で復号されたLPC係数を用いて復号化する点が図12の拡張レイヤ復号化器1004と異なる。
変換テーブル1301は、基本レイヤのLPC係数と拡張レイヤのLPC係数とを対応づけて記憶する。
LPC係数マッピング部1302は、変換テーブル1301を参照し、基本レイヤ復号化器1002から入力された基本レイヤのLPC係数を拡張レイヤのLPC係数に変換し、スペクトル包絡算出器1303に出力する。
スペクトル包絡算出器1303は、拡張レイヤのLPC係数に基づいてスペクトル包絡を求め、変形部1304に出力する。変形部1304は、スペクトル包絡を変形し、乗算器1207及びベクトル復号器1204に出力する。例えば、変形の方法は、実施の形態2の式(16)で示される方法がある。
次に、図13の拡張レイヤ復号化器1004の動作について説明する。基本レイヤのLPC係数は、信号帯域が0〜FLの信号に対して求められたものであり、拡張レイヤの対象となる信号(信号帯域0〜FH)で使用するLPC係数とは一致しない。しかしながら、両者には強い相関がある。よってLPC係数マッピング部1302では、この相関を利用してあらかじめ信号帯域0〜FLの信号用のLPC係数と信号帯域0〜FHの信号用のLPC係数との対応付けを表す変換テーブル1301を別途設計しておく。この変換テーブル1301を用いて、基本レイヤのLPC係数から拡張レイヤのLPC係数を求める。
変換テーブル1301の詳細は、実施の形態2の変換テーブル601と同様である。
このように、本実施の形態の信号処理装置によれば、基本レイヤ復号化器で量子化したLPC係数を用いて拡張レイヤのLPC係数を求め、拡張レイヤのLPC分析からスペクトル包絡を算出することより、LPC分析および量子化の必要がなくなり、量子化ビット数を削減することができる。
(実施の形態7)
図14は、本発明の実施の形態7に係る信号処理装置の拡張レイヤ復号化器の構成を示すブロック図である。但し、図12と同一の構成となるものについては、図12と同一番号を付し、詳しい説明を省略する。
図14の拡張レイヤ復号化器1004は、スペクトル微細構造算出器1401を具備し、基本レイヤ復号化器1002で復号化されたピッチ周期を用いてスペクトル微細構造を算出し、当該スペクトル微細構造を復号化に活用し、量子化性能を向上させた音響符号化に対応した音響復号化を行う点が図12の拡張レイヤ符号化器と異なる。
スペクトル微細構造算出器1401は、基本レイヤ復号化器1002で復号化されたピッチ周期Tとピッチゲインβからスペクトル微細構造を算出し、ベクトル復号化器1204及び乗算器1207に出力する。
具体的には、これらピッチ周期Tとピッチゲインβは符号化コードの一部であり、ここでは図示されない音響復号器において同じ情報を得ることができる。よって、ピッチ周期Tとピッチゲインβを利用して符号化を行ったとしてもビットレートが増加することはない。
スペクトル微細構造算出器1401では、ピッチ周期Tとピッチゲインβを用いて上式(17)に従いスペクトル微細構造har(m)を算出する。
そして、スペクトル包絡算出器1203で求められたスペクトル包絡env(m)とスペクトル微細構造算出器1401で求められたスペクトル微細構造har(m)を用いて、ベクトル復号化器1204での量子化ビット配分が決定される。そして、当該量子化ビット配分とデマルチプレクサ1201から得られる符号化コードから正規化MDCT係数X3(m)が復号される。さらに、乗算器1207において次の式(30)に従い、正規化MDCT係数X2(m)にスペクトル包絡env(m)とスペクトル微細構造har(m)を乗じて正規化MDCT係数X1(m)が求められる。
Figure 2005258478
このように、本実施の形態の信号処理装置は、基本レイヤ符号化器で符号化され局所復号化器で復号されたピッチ周期を用いてスペクトル微細構造を算出し、当該スペクトル微細構造をスペクトルの正規化およびベクトル量子化に活用することにより、量子化性能を向上させた音響符号化に対応した音響復号化を行うことができる。
(実施の形態8)
図15は、本発明の実施の形態8に係る信号処理装置の拡張レイヤ復号化器の構成を示すブロック図である。但し、図12と同一の構成となるものについては、図12と同一番号を付し、詳しい説明を省略する。
図15の拡張レイヤ復号化器1004は、パワー推定器1501と、パワー変化量復号化器1502と、パワー生成器1503とを具備し、基本レイヤの復号信号を利用してMDCT係数のパワーを予測し、その予測値からの変化量を符号化する符号化器に対応する復号化器を構成している点が図12の拡張レイヤ復号化器と異なる。
また、図10において、基本レイヤ復号化器1002から拡張レイヤ復号化器1004に復号されたパラメータが出力されているが、本実施の形態では、さらに基本レイヤ復号化器1002において得られる復号信号が拡張レイヤ復号化器1004に出力される。
パワー推定器1501は、基本レイヤ復号化器1002において復号化された復号信号sl(n)からMDCT係数のパワーを式(20)または式(21)を用いて推定する。
パワー変化量復号化器1502では、デマルチプレクサ1201から得られる符号化コードからパワー変化量を復号し、パワー生成器1503に出力する。パワー生成器1503は、パワー変化量からパワーを算出する。
乗算器1209は、次の式(31)に従いMDCT係数を求める。ここで、rqはパワー変化量の復号値、powpはパワー推定値を示す。また、X1(m)は乗算器1207の出力信号を示す。
Figure 2005258478
このように、本実施の形態の信号処理装置によれば、基本レイヤの復号信号を利用してMDCT係数のパワーを予測し、その予測値からの変化量を符号化する符号化器に対応する復号化器を構成していることにより、MDCT係数のパワーの量子化に必要なビット数を削減することができる。
(実施の形態9)
次に、本発明の実施の形態9について、図面を参照して説明する。図16は、本発明の実施の形態9に係る音響信号符号化装置の構成を示すブロック図である。図16における信号処理装置1603は前述した実施の形態1から実施の形態4に示した信号処理装置の中の1つによって構成されている点に本実施の形態の特徴がある。
図16に示すように、本発明の実施の形態9に係る通信装置1600は、入力装置1601、A/D変換装置1602及びネットワーク1604に接続されている信号処理装置1603を具備している。
A/D変換装置1602は、入力装置1601の出力端子に接続されている。信号処理装置1603の入力端子は、A/D変換装置1602の出力端子に接続されている。信号処理装置1603の出力端子はネットワーク1604に接続されている。
入力装置1601は、人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置1602に与える。A/D変換装置1602はアナログ信号をディジタル信号に変換して信号処理装置1603に与える。信号処理装置1603は入力されてくるディジタル信号を符号化してコードを生成し、ネットワーク1604に出力する。
このように、本発明の実施の形態の通信装置によれば、通信において前述した実施の形態1〜4に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化する音響符号化装置を提供することができる。
(実施の形態10)
次に、本発明の実施の形態10について、図面を参照して説明する。図17は、本発明の実施の形態10に係る音響信号復号化装置の構成を示すブロック図である。図17における信号処理装置1703は前述した実施の形態5から実施の形態8に示した信号処理装置の中の1つによって構成されている点に本実施の形態の特徴がある。
図17に示すように、本発明の実施の形態10に係る通信装置1700は、ネットワーク1701に接続されている受信装置1702、信号処理装置1703、及びD/A変換装置1704及び出力装置1705を具備している。
受信装置1702の入力端子は、ネットワーク1701に接続されている。信号処理装置1703の入力端子は、受信装置1702の出力端子に接続されている。D/A変換装置1704の入力端子は、信号処理装置1703の出力端子に接続されている。出力装置1705の入力端子は、D/A変換装置1704の出力端子に接続されている。
受信装置1702は、ネットワーク1701からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して信号処理装置1703に与える。信号処理装置1703は、受信装置1702からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置1704に与える。D/A変換装置1704は、信号処理装置1703からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1705に与える。出力装置1705は、電気的信号であるアナログの復号化音響信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
このように、本実施の形態の通信装置によれば、通信において前述した実施の形態5〜8に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
(実施の形態11)
次に、本発明の実施の形態11について、図面を参照して説明する。図18は、本発明の実施の形態11に係る音響信号送信符号化装置の構成を示すブロック図である。本発明の実施の形態11において、図18における信号処理装置1803は、前述した実施の形態1から実施の形態4に示した音響符号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
図18に示すように、本発明の実施の形態11に係る通信装置1800は、入力装置1801、A/D変換装置1802、信号処理装置1803、RF変調装置1804及びアンテナ1805を具備している。
入力装置1801は人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置1802に与える。A/D変換装置1802はアナログ信号をディジタル信号に変換して信号処理装置1803に与える。信号処理装置1803は入力されてくるディジタル信号を符号化して符号化音響信号を生成し、RF変調装置1804に与える。RF変調装置1804は、符号化音響信号を変調して変調符号化音響信号を生成し、アンテナ1805に与える。アンテナ1805は、変調符号化音響信号を電波として送信する。
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態1〜4に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化することができる。
なお、本発明は、オーディオ信号を用いる送信装置、送信符号化装置又は音響信号符号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
(実施の形態12)
次に、本発明の実施の形態12について、図面を参照して説明する。図19は、本発明の実施の形態12に係る音響信号受信復号化装置の構成を示すブロック図である。本発明の実施の形態12において、図19における信号処理装置1903は、前述した実施の形態5から実施の形態8に示した音響復号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
図19に示すように、本発明の実施の形態12に係る通信装置1900は、アンテナ1901、RF復調装置1902、信号処理装置1903、D/A変換装置1904及び出力装置1905を具備している。
アンテナ1901は、電波としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置1902に与える。RF復調装置1902は、アンテナ1901からの受信符号化音響信号を復調して復調符号化音響信号を生成して信号処理装置1903に与える。
信号処理装置1903は、RF復調装置1902からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置1904に与える。D/A変換装置1904は、信号処理装置1903からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1905に与える。出力装置1905は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態5〜8に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
また、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態では、信号処理装置として行う場合について説明しているが、これに限られるものではなく、この信号処理方法をソフトウェアとして行うことも可能である。
例えば、上記信号処理方法を実行するプログラムを予めROM(Read Only Memory)に格納しておき、そのプログラムをCPU(Central Processor Unit)によって動作させるようにしても良い。
また、上記信号処理方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのRAM(Random Access memory)に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
また、上記説明では、拡張レイヤ符号化にMDCT変換を用い、拡張レイヤ復号化にIMDCT変換を用いているが、これに限定されず、直交変換方法であればいずれも適用できる。
本発明の実施の形態1に係る信号処理装置の構成を示すブロック図 入力信号の成分の一例を示す図 上記実施の形態に係る信号処理装置の信号処理方法の一例を示す図 基本レイヤ符号化器の構成の一例を示す図 拡張レイヤ符号化器の構成の一例を示す図 拡張レイヤ符号化器の構成の一例を示す図 拡張LPC係数算出の一例を示す図 本発明の実施の形態3に係る信号処理装置の拡張レイヤ符号化器の構成を示すブロック図 本発明の実施の形態4に係る信号処理装置の拡張レイヤ符号化器の構成を示すブロック図 本発明の実施の形態5に係る信号処理装置の構成を示すブロック図 基本レイヤ復号化器の一例を示すブロック図 拡張レイヤ復号化器の一例を示すブロック図 拡張レイヤ復号化器の構成の一例を示す図 本発明の実施の形態7に係る信号処理装置の拡張レイヤ復号化器の構成を示すブロック図 本発明の実施の形態8に係る信号処理装置の拡張レイヤ復号化器の構成を示すブロック図 本発明の実施の形態9に係る音響信号符号化装置の構成を示すブロック図 本発明の実施の形態10に係る音響信号復号化装置の構成を示すブロック図 本発明の実施の形態11に係る音響信号送信符号化装置の構成を示すブロック図 本発明の実施の形態12に係る音響信号受信復号化装置の構成を示すブロック図
符号の説明
101 ダウンサンプリング器
102 基本レイヤ符号化器
103 局所復号化器
104、1003 アップサンプリング器
105 遅延器
106 減算器
107 拡張レイヤ符号化器
1002 基本レイヤ復号化器
1004 拡張レイヤ復号化器
1005 加算器

Claims (2)

  1. 入力信号のサンプリングレートを下げるダウンサンプリング手段と、
    サンプリングレートを下げた入力信号を符号化して第1符号化コードを得る基本レイヤ符号化手段と、
    前記第1符号化コードに基づいて復号信号を生成する復号化手段と、
    前記復号信号のサンプリングレートを前記入力信号と同一のレートに上げるアップサンプリング手段と、
    前記復号化手段の復号処理の中で生成されたパラメータを利用し、前記入力信号と前記サンプリングレートを上げた復号信号との差分値を符号化して第2符号化コードを得る拡張レイヤ符号化手段と、
    前記第1符号化コードと前記第2符号化コードとを多重する多重手段と、を具備し、
    前記拡張レイヤ符号化手段は、前記復号化手段の復号処理の中で生成されたピッチ周期およびピッチゲインを利用して符号化処理を行う、
    符号化装置。
  2. 前記拡張レイヤ符号化手段は、ピッチ周期とピッチゲインを用いてスペクトル微細構造を算出し、符号化処理におけるスペクトル正規化およびベクトル量子化に前記スペクトル微細構造を活用する、
    請求項1記載の符号化装置。
JP2005166279A 2005-06-06 2005-06-06 符号化装置 Expired - Lifetime JP4287840B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005166279A JP4287840B2 (ja) 2005-06-06 2005-06-06 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005166279A JP4287840B2 (ja) 2005-06-06 2005-06-06 符号化装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002127541A Division JP2003323199A (ja) 2002-04-26 2002-04-26 符号化装置、復号化装置及び符号化方法、復号化方法

Publications (3)

Publication Number Publication Date
JP2005258478A true JP2005258478A (ja) 2005-09-22
JP2005258478A5 JP2005258478A5 (ja) 2006-10-19
JP4287840B2 JP4287840B2 (ja) 2009-07-01

Family

ID=35084168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005166279A Expired - Lifetime JP4287840B2 (ja) 2005-06-06 2005-06-06 符号化装置

Country Status (1)

Country Link
JP (1) JP4287840B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010500819A (ja) * 2006-08-11 2010-01-07 株式会社エヌ・ティ・ティ・ドコモ 複数の量子化パターンの効率的な知覚的関連検索による音声及びオーディオを量子化するための方法
EP3079150A4 (en) * 2014-04-29 2016-12-07 Huawei Tech Co Ltd METHOD AND DEVICE FOR SIGNAL PROCESSING

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010500819A (ja) * 2006-08-11 2010-01-07 株式会社エヌ・ティ・ティ・ドコモ 複数の量子化パターンの効率的な知覚的関連検索による音声及びオーディオを量子化するための方法
EP3079150A4 (en) * 2014-04-29 2016-12-07 Huawei Tech Co Ltd METHOD AND DEVICE FOR SIGNAL PROCESSING
AU2014392351B2 (en) * 2014-04-29 2017-09-14 Huawei Technologies Co., Ltd. Signal processing method and device
US9837088B2 (en) 2014-04-29 2017-12-05 Huawei Technologies Co., Ltd. Signal processing method and device
KR101830855B1 (ko) * 2014-04-29 2018-02-21 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
KR20180019761A (ko) * 2014-04-29 2018-02-26 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
JP2018041091A (ja) * 2014-04-29 2018-03-15 華為技術有限公司Huawei Technologies Co.,Ltd. 信号処理方法及び装置
RU2656812C2 (ru) * 2014-04-29 2018-06-06 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство обработки сигналов
KR101890346B1 (ko) * 2014-04-29 2018-08-21 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
KR20180095120A (ko) * 2014-04-29 2018-08-24 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
US10186271B2 (en) 2014-04-29 2019-01-22 Huawei Technologies Co., Ltd. Signal processing method and device
KR20190049954A (ko) * 2014-04-29 2019-05-09 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
KR101977383B1 (ko) 2014-04-29 2019-05-10 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
RU2688259C2 (ru) * 2014-04-29 2019-05-21 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство обработки сигналов
US10347264B2 (en) 2014-04-29 2019-07-09 Huawei Technologies Co., Ltd. Signal processing method and device
JP2019152871A (ja) * 2014-04-29 2019-09-12 華為技術有限公司Huawei Technologies Co.,Ltd. 信号処理方法及び装置
KR102052487B1 (ko) 2014-04-29 2019-12-05 후아웨이 테크놀러지 컴퍼니 리미티드 신호 처리 방법 및 디바이스
US10546591B2 (en) 2014-04-29 2020-01-28 Huawei Technologies Co., Ltd. Signal processing method and device
EP3637417A1 (en) * 2014-04-29 2020-04-15 Huawei Technologies Co., Ltd. Signal processing method and device
JP2021043453A (ja) * 2014-04-29 2021-03-18 華為技術有限公司Huawei Technologies Co.,Ltd. 信号処理方法及び装置
US11081121B2 (en) 2014-04-29 2021-08-03 Huawei Technologies Co., Ltd. Signal processing method and device
JP7144499B2 (ja) 2014-04-29 2022-09-29 華為技術有限公司 信号処理方法及び装置
US11580996B2 (en) 2014-04-29 2023-02-14 Huawei Technologies Co., Ltd. Signal processing method and device
US11881226B2 (en) 2014-04-29 2024-01-23 Huawei Technologies Co., Ltd. Signal processing method and device

Also Published As

Publication number Publication date
JP4287840B2 (ja) 2009-07-01

Similar Documents

Publication Publication Date Title
EP1489599B1 (en) Coding device and decoding device
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP2003323199A (ja) 符号化装置、復号化装置及び符号化方法、復号化方法
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP4958780B2 (ja) 符号化装置、復号化装置及びこれらの方法
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
JP2001222297A (ja) マルチバンドハーモニック変換コーダ
CN104123946A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
US20090171673A1 (en) Encoding apparatus and encoding method
KR20070121254A (ko) 광대역 부호화 및 복호화 방법 및 장치
JP4789622B2 (ja) スペクトル符号化装置、スケーラブル符号化装置、復号化装置、およびこれらの方法
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP4287840B2 (ja) 符号化装置
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
KR0156983B1 (ko) 음성 부호기
KR20080095492A (ko) 오디오/스피치 신호의 시간 도메인에서의 부호화 방법
JPH0537393A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090327

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120403

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4287840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130403

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130403

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140403

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term