JP2004301954A - Hierarchical encoding method and hierarchical decoding method for sound signal - Google Patents
Hierarchical encoding method and hierarchical decoding method for sound signal Download PDFInfo
- Publication number
- JP2004301954A JP2004301954A JP2003092581A JP2003092581A JP2004301954A JP 2004301954 A JP2004301954 A JP 2004301954A JP 2003092581 A JP2003092581 A JP 2003092581A JP 2003092581 A JP2003092581 A JP 2003092581A JP 2004301954 A JP2004301954 A JP 2004301954A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoding
- decoding
- layer
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、音響信号の階層符号化方法および階層復号化方法に関し、特に楽音信号または音声信号などの音響信号を高能率に圧縮符号化に用いて好適な音響信号の階層符号化方法および階層復号化方法に関する。
【0002】
【従来の技術】
楽音信号または音声信号を低ビットレートで圧縮する音響符号化技術は、移動体通信における電波等の伝送路容量及び記録媒体の有効利用のために重要である。音声信号を符号化する音声符号化に、ITU(International Telecommunication Union)で規格化されているG726、G729などの方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を対象とし、8kbit/s〜32kbit/sで高品質に符号化が行える。また、広帯域信号(50Hz〜7kHz)を対象とする標準方式としてITUのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WBなどが存在する。これらの方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号を高品質に符号化できる。
【0003】
音声信号を低ビットレートで高能率に符号化を行う有効な方法に、CELP(Code Excited Linear Prediction)がある。CELPは、人間の音声生成モデルを工学的に模擬したモデルに基づき、乱数やパルス列で表される励振信号を周期性の強さに対応するピッチフィルタと声道特性に対応する合成フィルタに通し、その出力信号と入力信号の二乗誤差が聴覚特性の重み付けの下で最小になるよう符号化コードを決定する方法である(例えば、非特許文献1参照)。最近の標準音声符号化方式の多くがCELPに基づいており、例えばG729は8kbit/sで狭帯域信号の符号化が行え、AMR−WBは6.6kbit/s〜23.85kbit/sで広帯域信号を符号化できる。
【0004】
一方で、楽音信号を符号化する楽音符号化の場合は、MPEG(Moving Picture Expert Group)で規格化されているレイヤIII方式やAAC方式のように、楽音信号を周波数領域に変換し、聴覚心理モデルを利用して符号化を行う変換符号化が一般的である。これらの方式は、サンプリング周波数が44.1kHzの信号に対しチャネル当たり64kbit/s〜96kbit/sで聴感的な劣化がほとんど生じないことが知られている。
【0005】
しかしながら、音声信号が主体で、背景に音楽や環境音が重畳している信号を符号化する場合、音声符号化方式を適用すると背景部の音楽や環境音の影響で、背景部の信号のみならず音声信号も劣化してしまい全体的な品質が低下するという問題があった。これは、音声符号化方式が、CELPという音声モデルに特化した方式を基本にしているために生じる問題である。また、音声符号化方式が対応できる信号帯域は高々7kHzまでであり、それ以上の高域を持つ信号に対しては構成上十分に対応しきれないという問題があった。
【0006】
一方で、楽音符号化は音楽に対して高品質に符号化を行えるので、前述したような背景に音楽や環境音がある音声信号についても十分な品質を得ることができる。対象となる信号の帯域もCD品質である22kHz程度まで対応可能である。その反面、高品質な符号化を実現するためにはビットレートを高くして使用する必要があり、仮にビットレートを32kbit/s程度まで低く抑えると復号信号の品質が大きく低下するという問題がある。そのため、伝送レートの低い通信網で使用できないという問題があった。
【0007】
上述した問題を回避するためにこれら技術を組み合わせて、最初に入力信号を第1レイヤにてCELPで符号化し、次にその復号信号を入力信号から減算して得られる残差信号を求め、この信号を第2レイヤ以降にて変換符号化を行う方法が考えられる。この方法では、第1レイヤはCELPを用いているため音声信号を高品質に符号化でき、かつ第2レイヤ以降では第1レイヤで表しきれない背景の音楽や環境音、第1レイヤでカバーする周波数帯よりも高い周波数成分の信号を効率よく符号化することができる。
【0008】
しかしながら、音声ではなく音楽を入力したときに十分な品質を確保するためには、第2レイヤ以降へのビット配分を多くする必要があり、その結果ビットレートが高くなってしまうという問題がある。これは第1レイヤにCELPのような音声に特化した符号化方式を適用しているために生じる問題である。つまり、音楽信号が入力されたとき、第1レイヤで用いられるCELPでは音楽に対する符号化効率が高くないので、入力信号と第1レイヤの復号信号との誤差信号(つまり第2レイヤの入力信号)のパワーが大きくなる。この結果、第2レイヤ以降のレイヤに多くのビットを配分して、最終的な復号信号の品質を上げる必要があった。
【0009】
【非特許文献1】
”Code−Excited Linear Prediction (CELP): high quality speech at very low bit rates”, Proc. ICASSP 85, pp.937−940, 1985.
【0010】
【発明が解決しようとする課題】
このように、従来の装置においては、低ビットレートで高品質な符号化を行うことが難しいという問題がある。
【0011】
本発明はかかる点に鑑みてなされたものであり、低ビットレートで高品質な符号化を行うことができる音響信号の階層符号化方法および階層復号化方法を提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明の階層符号化方法は、入力音声信号を符号化し、前段で符号化した信号を復号し、この復号信号と入力信号との差分を符号化する階層符号化方法であって、所定の長さのフレーム単位で入力音響信号を符号化する第1符号化工程と、前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化する第2符号化工程と、前記第2符号化工程の符号化結果を復号化した信号から予測残差信号を生成する予測フィルタ工程と、前記予測フィルタ工程の予測に基づいて符号化に用いる符号帳を更新する更新工程と具備するようにした。
【0013】
本発明の階層符号化方法は、前記第1符号化工程は、入力音響信号をCELP符号化し、前記予測フィルタ工程は、量子化後のLPC係数を用いて予測フィルタを生成し、前記更新工程は、前記第2符号化手段の符号化結果を復号化した信号を前記予測フィルタに通した結果を用いて符号帳を更新するようにした。
【0014】
これらの方法によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから上位レイヤの符号化で発生する予測残差信号を生成し、この予測残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化することができ、低ビットレートで高品質な符号化を行うことができる。
【0015】
本発明の階層符号化方法は、入力音響信号をダウンサンプリングするダウンサンプリング工程と、前段の符号化結果を復号化した信号をアップサンプリングするアップサンプリング工程とを具備し、前記第2符号化工程は、アップサンプリング後の前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化するようにした。
【0016】
この方法によれば、下位レイヤで符号化する信号のサンプリング周波数を上位レイヤで符号化する信号のサンプリング周波数より高くすることにより、様々なサンプリング周波数に対応させて入力信号を符号化することができる。
【0017】
本発明の階層符号化方法は、入力音響信号の周期性を測定する周期性算出工程を具備し、前記更新工程は、前記周期性が所定のしきい値以上である場合に前記予測フィルタ工程の予測で得られる予測残差信号を用いて符号帳を更新し、前記周期性が所定のしきい値未満である場合に生成した駆動音源信号とのいずれかを用いて符号帳を更新するようにした。
【0018】
この方法によれば、入力音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより適応符号帳による予測精度が増し性能が向上する。また、本実施の形態の階層符号化装置によれば、入力音響信号の周期性が強くない場合には駆動音源信号を使って適応符号帳の内部状態を更新することにより、非周期的な信号に対する効果を上げることができる。
【0019】
本発明の階層符号化方法は、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪のいずれが小さいかを判定する判定工程を具備し、前記更新工程は、前記歪みが小さい信号を用いて符号帳を更新するようにした。
【0020】
この方法によれば、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定する際に、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪を算出して比較し、歪が小さくなる信号を用いて適応符号帳の内部状態を更新することにより、歪の小さくなる信号を常に使って適応符号帳の内部状態を更新することになるので、品質を向上することができる。
【0021】
本発明の階層復号化方法は、符号側で入力音声信号を符号化し、前段で符号化した信号を復号し、この復号信号と入力信号との差分を符号化した信号を復号する階層復号化方法であって、所定の長さのフレーム単位で入力音響信号を符号化した信号を復号する第1復号化工程と、前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化した信号をそれぞれ復号して加算する第2復号化工程と、前記第1復号化工程と前記第2復号化工程の復号結果から予測残差信号を生成する予測フィルタ工程と、前記予測フィルタ工程の予測に基づいて復号化に用いる符号帳を更新する更新工程と、を具備するようにした。
【0022】
本発明の階層復号化方法は、前記第1復号化工程は、入力音響信号をCELP符号化方式で信号を復号し、前記予測フィルタ工程は、符号化側で符号化されたLPC係数を復号して得られるLPC係数を用いて予測フィルタを生成し、前記更新工程は、前記第1復号化工程と前記第2復号化工程の復号結果を前記予測フィルタに通した結果を用いて符号帳を更新するようにした。
【0023】
これらの方法によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化方法の復号において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから上位レイヤの符号化で発生する残差信号を予測し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で復号することができ、低ビットレートで高品質な信号を復号できる。
【0024】
本発明の階層復号化方法は、前段の復号化結果をアップサンプリングするアップサンプリング工程と、アップサンプリングした復号結果と後段の復号結果を加算する加算工程と、前記加算結果をダウンサンプリングするダウンサンプリング工程と、を具備し、前記予測フィルタ工程は、ダウンサンプリング後の復号結果から予測残差信号を生成するようにした。
【0025】
この方法によれば、下位レイヤで復号する信号のサンプリング周波数を上位レイヤで復号する信号のサンプリング周波数より高くすることにより、様々なサンプリング周波数に対応させて信号を符号化した信号を復号することができる。
【0026】
本発明の階層復号化方法は、前記更新工程は、符号化側において前記予測フィルタ工程の予測で得られる予測残差信号と生成した駆動音源信号とのいずれかを用いて適応符号帳を更新するか判定した結果に基づいて符号帳を更新するようにした。
【0027】
本発明の階層符号化装置は、入力音声信号を符号化し、前段で符号化した信号を復号し、この復号信号と入力信号との差分を符号化する階層符号化装置であって、所定の長さのフレーム単位で入力音響信号を符号化する第1符号化手段と、前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化する第2符号化手段と、前記第2符号化手段の符号化結果を復号化した信号から予測残差信号を生成する予測フィルタ手段と、を具備し、前記第1符号化手段は、前記予測フィルタ手段の予測に基づいて符号化に用いる符号帳を更新するようにした。
【0028】
この構成によれば、符号側において入力音響信号の周期性の強さ等に基づいて、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定した結果に基づいて、符号化された音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより、階層符号化法の符号化コードを復号することができ、その結果高品質な音響信号を復号することができる。
【0029】
本発明の階層符号化装置は、前記第1符号化手段は、入力音響信号をCELP符号化する手段であって、過去に生成した駆動音源信号を保持する符号帳と、入力音響信号からLPC係数を求めるLPC分析手段と、入力音声信号と差が最も小さい駆動音源信号を探索する探索手段と、を具備し、前記予測フィルタ手段は、量子化後のLPC係数を用いて予測フィルタを生成し、前記第1符号化手段は、前記第2符号化手段の符号化結果を復号化した信号を前記予測フィルタに通した結果を用いて符号帳を更新する構成を採る。
【0030】
この構成によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化することができ、低ビットレートで高品質な符号化を行うことができる。
【0031】
本発明の階層符号化装置は、入力音響信号をダウンサンプリングして前記第1符号化手段または前記第2符号化手段に出力するダウンサンプリング手段と、前段の符号化結果を復号化した信号をアップサンプリングするアップサンプリング手段とを具備し、前記第2符号化手段は、アップサンプリング後の前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化する構成を採る。
【0032】
この構成によれば、下位レイヤで符号化する信号のサンプリング周波数を上位レイヤで符号化する信号のサンプリング周波数より高くすることにより、様々なサンプリング周波数に対応させて入力信号を符号化することができる。
【0033】
本発明の階層符号化装置は、前記第1符号化手段は、前記予測フィルタ手段の予測で得られる予測残差信号と生成した駆動音源信号とのいずれかを用いて適応符号帳を更新するか判定する判定手段を具備する構成を採る。
【0034】
本発明の階層符号化装置は、前記第1符号化手段は、入力音響信号の周期性を測定する周期性算出手段を具備し、前記判定手段は、前記周期性が所定のしきい値以上である場合に前記予測フィルタ手段の予測で得られる予測残差信号を用いて符号帳を更新し、前記周期性が所定のしきい値未満である場合に生成した駆動音源信号とを用いて符号帳を更新する判定をする構成を採る。
【0035】
これらの構成によれば、入力音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより適応符号帳による予測精度が増し性能が向上する。また、本実施の形態の階層符号化装置によれば、入力音響信号の周期性が強くない場合には駆動音源信号を使って適応符号帳の内部状態を更新することにより、非周期的な信号に対する効果を上げることができる。
【0036】
本発明の階層符号化装置は、前記判定手段は、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪のいずれが小さいかを判定し、前記第1符号化手段は、前記歪みが小さい信号を用いて符号帳を更新する判定をする構成を採る。
【0037】
この構成によれば、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定する際に、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪を算出して比較し、歪が小さくなる信号を用いて適応符号帳の内部状態を更新することにより、歪の小さくなる信号を常に使って適応符号帳の内部状態を更新することになるので、品質を向上することができる。
【0038】
本発明の階層復号化装置は、符号側で入力音声信号を符号化し、前段で符号化した信号を復号し、この復号信号と入力信号との差分を符号化した信号を復号する階層復号化装置であって、所定の長さのフレーム単位で入力音響信号を符号化した信号を復号する第1復号化手段と、前段の符号化結果を復号化した信号と入力音響信号との差分を1段または複数段で符号化した信号をそれぞれ復号して加算する第2復号化手段と、前記第1復号化手段と前記第2復号化手段の復号結果から予測残差信号を生成する予測フィルタ手段と、を具備し、前記復号化手段は、前記予測フィルタ手段の予測に基づいて復号化に用いる符号帳を更新する構成を採る。
【0039】
本発明の階層復号化装置は、前記第1復号化手段は、入力音響信号をCELP符号化方式で信号を復号する手段であって、前記予測フィルタ手段は、符号化側で符号化されたLPC係数を復号して得られるLPC係数を用いて予測フィルタを生成し、前記第1復号化手段は、前記第1復号化手段と前記第2復号化手段の復号結果を前記予測フィルタに通した結果を用いて符号帳を更新する構成を採る。
【0040】
これらの構成によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化方法の復号において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で復号することができ、低ビットレートで高品質な信号を復号できる。
【0041】
本発明の階層復号化装置は、前段の復号化結果をアップサンプリングするアップサンプリング手段と、アップサンプリングした復号結果と後段の復号結果を加算する加算手段と、前記加算手段の加算結果をダウンサンプリングするダウンサンプリング手段と、を具備し、前記フィルタ手段は、ダウンサンプリング後の復号結果から予測残差信号を生成する構成を採る。
【0042】
この構成によれば、下位レイヤで復号する信号のサンプリング周波数を上位レイヤで復号する信号のサンプリング周波数より高くすることにより、様々なサンプリング周波数に対応させて信号を符号化した信号を復号することができる。
【0043】
本発明の階層復号化装置は、前記第1復号化手段は、符号化側において前記予測フィルタ手段の予測で得られる予測残差信号と生成した駆動音源信号とのいずれかを用いて適応符号帳を更新するか判定した結果に基づいて符号帳を更新する構成を採る。
【0044】
この構成によれば、符号側において入力音響信号の周期性の強さ等に基づいて、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定した結果に基づいて、符号化された音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより、階層符号化法の符号化コードを復号することができ、その結果高品質な音響信号を復号することができる。
【0045】
本発明の音響信号送信装置は、音響信号を電気的信号に変換する音響入力手段と、この音響入力手段から出力された信号をディジタル信号に変換するA/D変換手段と、このA/D変換手段から出力されたディジタル信号を符号化する上記階層符号化装置と、この符号化装置から出力された符号化コードを無線周波数の信号に変調するRF変調手段と、このRF変調手段から出力された信号を電波に変換して送信する送信アンテナと、を具備する構成を採る。
【0046】
この構成によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化することができ、低ビットレートで高品質な符号化を行うことができる。
【0047】
本発明の音響信号受信装置は、電波を受信する受信アンテナと、この受信アンテナに受信された信号を復調するRF復調手段と、このRF復調手段にて得られた情報を復号する上記階層復号化装置と、この復号化装置から出力された信号をアナログ信号に変換するD/A変換手段と、このD/A変換手段から出力された電気的信号を音響信号に変換する音響出力手段と、を具備する構成を採る。
【0048】
この構成によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化方法の復号において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で復号することができ、低ビットレートで高品質な信号を復号できる。
【0049】
本発明の通信端末装置は、上記音響信号送信装置あるいは上記音響信号受信装置の少なくとも一方を具備する構成を採る。本発明の基地局装置は、上記音響信号送信装置あるいは上記音響信号受信装置の少なくとも一方を具備する構成を採る。
【0050】
これらの構成によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化することができ、低ビットレートで高品質な符号化を行うことができる。
【0051】
【発明の実施の形態】
本発明の骨子は、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化して低ビットレートで高品質な符号化を行うことである。
【0052】
以下、本発明の実施の形態について図面を参照して詳細に説明する。以降の実施の形態の説明ではレイヤ数Nを3にした場合について説明するが、本発明はこの数値に限定されるものではなく、N≧2の条件を満たす構成に適用することが可能である。
【0053】
(実施の形態1)
図1は、本発明の実施の形態1に係る階層符号化装置の構成を示すブロック図である。図1の階層符号化装置100は、入力端子101と、第1レイヤ符号化部102と、第1レイヤ復号化部103と、遅延器104と、減算器105と、第2レイヤ符号化部106と、第2レイヤ復号化部107と、加算器108と、遅延器109と、減算器110と、第3レイヤ符号化部111と、第3レイヤ復号化部112と、加算器113と、多重化部114と、出力端子115と、予測フィルタ116とから主に構成される。
【0054】
本実施の形態では、各レイヤに入力される信号のサンプリング周波数は全て同じであるとし、サンプリング周波数をFsと表すものとする。入力端子101から、サンプリング周波数Fsの音響信号が入力され、第1レイヤ符号化部102に与えられる。
【0055】
第1レイヤ符号化部102は、過去に生成した駆動音源信号を内部状態として保持している適応符号帳を有し、適応符号帳を用いることで周期性の強い信号を効率的に符号化することができる。第1レイヤ符号化部102は、入力音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。第1レイヤ符号化部102に適用される代表的な方法として符号励信線形予測法(CELP)があるが、この詳細な説明は後述する。
【0056】
そして、第1レイヤ符号化部102は、得られた第1符号化コードを第1レイヤ復号化部103及び多重化部114に出力する。第1レイヤ復号化部103は、第1符号化コードを用いて第1レイヤ復号信号を生成し、この第1レイヤ復号信号を減算器105及び加算器108に出力する。
【0057】
遅延器104は、入力端子101から入力される音響信号を所定の時間長だけ遅延して減算器105に出力する。すなわち、遅延器104は、第1レイヤ符号化部102と第1レイヤ復号化部103で生じる遅延を補正する役割を持つ。
【0058】
減算器105は、遅延器104の出力信号と前述の第1レイヤ復号信号との差をとり第2レイヤ残差信号を生成する。そして、減算器105は、第2レイヤ残差信号を第2レイヤ符号化部106に出力する。
【0059】
第2レイヤ符号化部106は、第2レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第2符号化コードを決定する。そして、第2レイヤ符号化部106は、第2レイヤ復号化部107と第2符号化コードを多重化部114に出力する。
【0060】
同様に第2レイヤ復号化部107に第2符号化コードを与え、第2レイヤ復号化部107は、第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成し、この第2レイヤ復号残差信号を加算器108に出力する。
【0061】
加算器108は、第1レイヤ復号信号と第2レイヤ復号残差信号の和をとり、第2レイヤ復号信号を生成する。そして、加算器108は、この第2レイヤ復号信号を減算器110と加算器113に出力する。
【0062】
次に、遅延器109は、入力端子101から入力される音響信号を所定の時間長だけ遅延した後、この音響信号を減算器110に出力する。すなわち、遅延器109は、前段までの符号化部と復号化部で生じる遅延、具体的には第1レイヤ符号化部102と第1レイヤ復号化部103および第2レイヤ符号化部106と第2レイヤ復号化部107で生じる遅延を補正する役割を持つ。
【0063】
減算器110は、遅延器109の出力信号と前述の第2レイヤ復号信号との差をとり第3レイヤ残差信号を生成する。そして、減算器110は、この第3レイヤ残差信号を第3レイヤ符号化部111に出力する。
【0064】
第3レイヤ符号化部111は、第3レイヤ残差信号を聴感的に品質改善が成されるように符号化して第3符号化コードを決定し、この第3符号化コードを第3レイヤ復号化部112と多重化部114に出力する。
【0065】
第3レイヤ復号化部112は、第3符号化コードを用いて復号処理を行い、第3レイヤ復号残差信号を生成し、この第3レイヤ復号残差信号を加算器113に出力する。
【0066】
加算器113は、第2レイヤ復号信号と第3レイヤ復号残差信号の和をとり、第3レイヤ復号信号を生成し、この第3レイヤ復号信号を予測フィルタ116に出力する。
【0067】
多重化部114は、第1符号化コード、第2符号化コードおよび第3符号化コードを所定の手段によって多重化を行い、符号化ビット列を生成する。そして、多重化部114は、この符号化ビット列を出力端子115より出力する。
【0068】
加算器113で生成された第3レイヤ復号信号は予測フィルタ116に与えられる。
【0069】
予測フィルタ116は、第3レイヤ復号信号に予測フィルタをかけ、予測残差信号を生成し、この予測残差信号を第1レイヤ符号化部102に出力する。予測フィルタは、第1レイヤ符号化部102で算出された量子化後のLPC係数により構成される。第3レイヤ復号信号をsyn3(k)、予測残差信号をe(k)、量子化後のLPC係数をαq(i)とすると、予測残差信号e(k)は次の式(1)で表される。
【0070】
【数1】
ここで、NPはLPC係数の次数を表す。
【0071】
第1レイヤ符号化部102は、上記説明で求めた予測残差信号を用いて、第1レイヤ符号化部102に内在する適応符号帳の内部状態として利用する。
【0072】
以下、第1レイヤ符号化部102の詳細について説明する。ここでは、第1レイヤ符号化部102にCELPを用いる場合を例にして説明するが、本発明の要件として第1レイヤ符号化部に過去の駆動音源信号を内部状態として保持している適応符号帳が存在する符号化方法であればよく、本発明はCELPに限定されるものではない。
【0073】
図2は、本実施の形態の階層符号化装置の第1レイヤ符号化部の内部構成を示すブロック図である。図2の第1レイヤ符号化部は、CELPの代表的な構成を基にしたときの構成図である。図2において破線枠で囲まれた部分が図1の第1レイヤ符号化部102に相当する。図2において、第1レイヤ符号化部102は、入力端子201と、LPC分析器202と、LPC量子化器203と、LPC復号器204と、聴感重みフィルタ205と、聴感重み付き合成フィルタ206と、適応符号帳207と、雑音符号帳208と、乗算器209と、乗算器210と、ゲイン符号帳211と、加算器212と、減算器213と、探索器214と、多重化部215と、出力端子216と、出力端子217と、入力端子218とから主に構成される。
【0074】
入力端子201には、図1の入力端子101から入力される音響信号が入力される。LPC分析器202は、入力端子201から入力されたサンプリングレートFsの音響信号からLPC係数を求める。このLPC係数は、聴感的な品質向上のために利用される。LPC分析器202は、このLPC係数をLPC量子化器203、聴感重みフィルタ205、及び聴感重み付き合成フィルタ206に出力する。
【0075】
LPC量子化器203は、LPC係数をLSP係数などの量子化に適したパラメータに変換し、量子化を行う。そして、LPC量子化器203は、この量子化で得られる符号化コードをLPC復号器204と多重化部215に出力する。
【0076】
LPC復号器204は、符号化コードから量子化後のLSP係数を算出し、LPC係数に変換して量子化後のLPC係数を求める。そして、LPC復号器204は、この量子化後のLPC係数を聴感重み付き合成フィルタ206と出力端子217に出力する。この量子化後のLPC係数は、適応符号帳、適応ゲイン、雑音符号帳および雑音ゲインの符号化に利用される。また、量子化後のLPC係数が出力端子217より出力され、前述したように図1の予測フィルタ116に与えられ、予測残差信号e(k)を求める際に利用される。
【0077】
聴感重みフィルタ205は、LPC分析器202で求められたLPC係数を基に入力信号に重み付けを行う。これは、量子化歪のスペクトルを入力信号のスペクトル包絡にマスクされるようスペクトル整形を行うことを目的として行われる。そして、聴感重みフィルタ205は、重み付けされた入力信号を減算器213に出力する。
【0078】
次に、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインの探索する構成の部分について説明する。
【0079】
適応符号帳207は、過去に生成した駆動音源信号を内部状態として保持し、この内部状態を所望のピッチ周期で繰り返すことにより適応ベクトルを生成する。ピッチ周期の取る範囲は、実際の音声のピッチ周期を勘案し60Hz〜400Hzの間が適当である。そして、適応符号帳207は、内部に保持した駆動音源信号を適応ベクトルとして順に乗算器209に出力する。
【0080】
乗算器209は、この適応ベクトルにゲイン符号帳211から出力される適応ベクトルゲインを乗算して加算器212に出力する。
【0081】
また、雑音符号帳208は、あらかじめ記憶領域に格納されている雑音ベクトル、もしくは代数(algebraic)構造のように記憶領域を持たずにルールに従い生成されるベクトルを雑音ベクトルとして出力する。
【0082】
乗算器210は、この雑音ベクトルにゲイン符号帳211から出力される雑音ベクトルゲインを乗算して加算器212に出力する。
【0083】
加算器212は、適応ベクトルゲインが乗じられた適応ベクトルと雑音ベクトルゲインが乗じられた雑音ベクトルとを加算して駆動音源信号を生成し、この駆動音源信号を聴感重み付き合成フィルタ206に出力する。
【0084】
聴感重み付き合成フィルタ206は、駆動音源信号を聴覚重み付き合成フィルタに通して聴覚重み付き合成信号を生成し、この聴覚重み付き合成信号を減算器213に出力する。
【0085】
減算器213は、聴覚重み付き入力信号から聴覚重み付き合成信号を減算し、減算後の信号を探索器214に出力する。
【0086】
探索器214は、減算後の信号から定義される歪が最小となる適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインの組み合わせを効率よく探索し、これら検索された符号化コードを多重化部215に出力する。
【0087】
探索器214は、以下の式(2)または式(3)で定義される歪を最小とする符号化コードi,j,mもしくは符号化コードi,j,m,nを決定してそれらを多重化部215に送る。
【0088】
【数2】
【数3】
ここで、t(k)は聴覚重み付き入力信号、pi(k)は第i番目の適応ベクトルを聴覚重み付き合成フィルタに通して得られる信号、ej(k)は第j番目の雑音ベクトルを聴覚重み付き合成フィルタに通して得られる信号、βとγはそれぞれ適応ベクトルゲインと雑音ベクトルゲインを表す。式(2)と式(3)とではゲイン符号帳の構成が異なり、式2の場合、ゲイン符号帳は適応ベクトルゲインβmと雑音ベクトルゲインγmを要素として持つベクトルとして表されており、ベクトルを特定するための符号化コードmが決定されることになる。式3の場合、ゲイン符号帳は適応ベクトルゲインβmと雑音ベクトルゲインγnをそれぞれ独立に有しており、それぞれの符号化コードm,nが独立に決定されることになる。
【0089】
適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインの最適化を同時に図ると演算量が膨大になるため対策が必要である。一般的には、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインの順に最適なベクトルまたは値を決定していく方法が採られる。
【0090】
そして、探索器214において符号化コードが決定された後に、多重化部215はこれらの符号化コードを一つにまとめて出力端子216より出力する。
【0091】
上記符号化処理が終了した後に、次のフレーム(もしくはサブフレーム)での符号化処理に備えて、適応符号帳の内部状態を更新する。
【0092】
予測フィルタ116は、加算器113より得られる第3レイヤ復号信号syn(n)と第1レイヤ符号化部102より得られる量子化後のLPC係数αq(i)を用いて、予測残差信号r(n)を出力する。この予測残差信号r(n)を用いて適応符号帳内の内部状態を更新することになる。予測フィルタ116は、量子化後のLPC係数αq(i)を用いて予測フィルタを構成し、この予測フィルタに第3レイヤ復号信号syn(n)を入力することにより予測残差信号r(n)を算出することになる。予測残差信号r(n)は次の式(4)に従い算出される。
【0093】
【数4】
ここでNPはLPC係数の次数を表す。
【0094】
本発明の特徴はこの上記説明の部分にあり、従来の方法では加算器212で求められた駆動音源信号を用いて適応符号帳207の内部状態を更新していたが、本発明では入力端子218から入力される予測フィルタ116の出力信号を用いて適応符号帳の内部状態を更新する。本発明の効果の説明を、図3を用いて行う。
【0095】
図3は、入力音響信号とそれに対応する第1レイヤ復号信号、第2レイヤ復号信号、第3レイヤ復号信号の関係を示す図である。従来の方法では、第1レイヤ復号信号に対応する駆動音源信号を用いて適応符号帳を更新している。
【0096】
各レイヤの復号信号を比較すると、最も入力音響信号に近い信号は第3レイヤ復号信号であり、次いで第2レイヤ復号信号、第1レイヤ復号信号の順となる。これは、本実施の形態ではレイヤが増すごとに入力音響信号と復号信号の誤差が小さくなるように符号化されていくことによる。一方で、適応符号帳の内部状態が入力音響信号と類似な状態になっているほど適応符号帳の性能は高くなる。そのため、第3レイヤ復号信号を用いて適応符号帳の内部状態を更新すると、より効率的な符号化が実現できる。適応符号帳の内部状態は駆動音源信号にする必要があるため、実際上は、第3レイヤ復号信号から、LPC係数を使って予測残差信号を求め、この予測残差信号を用いて適応符号帳の内部状態を更新することになる。
【0097】
このように、本実施の形態の階層符号化装置によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから上位レイヤの符号化で発生する残差信号を予測し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化することができ、低ビットレートで高品質な符号化を行うことができる。
【0098】
なお、上記説明では、予測フィルタ116が第3レイヤ復号信号と第1レイヤ符号化部102より得られる量子化後のLPC係数を用いて、予測残差信号を作成し、第1レイヤ符号化部102は、この予測残差信号を用いて適応符号帳の内部状態を更新しているが、予測フィルタ116が、第2レイヤ復号信号をもちいて予測残差信号を作成してもよい。すなわち、予測残差信号を作成するために必要な復号信号は、第1レイヤ符号化で符号化しきれない残差信号を符号化するレイヤであれば何段目であってもよい。
【0099】
図4は、本発明の実施の形態1に係る階層符号化装置の構成を示すブロック図である。図4において図1と同一の番号が付与されている構成要素については同一の機能を有するものとしてここでは説明を省略する。本実施の形態の特徴は、中間レイヤの復号信号(図4では第2レイヤ復号信号)を予測フィルタ116に与え、その出力信号を適応符号帳207の内部状態の更新に用いる点にある。この構成によれば、中間レイヤまでのスケーラビリティを確保できるという特徴がある。
【0100】
加算器108は、第1レイヤ復号信号と第2レイヤ復号残差信号の和をとり、第2レイヤ復号信号を生成する。そして、加算器108は、この第2レイヤ復号信号を減算器110と予測フィルタ116に出力する。
【0101】
予測フィルタ116は、第2レイヤ復号信号に予測フィルタをかけ、予測残差信号を生成し、この予測残差信号を第1レイヤ符号化部102に出力する。
【0102】
第1レイヤ符号化部102は、予測フィルタ116で求めた予測残差信号を用いて、第1レイヤ符号化部102に内在する適応符号帳の内部状態として利用する。第1レイヤ符号化部102は、入力音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。そして、第1レイヤ符号化部102は、得られた第1符号化コードを第1レイヤ復号化部103及び多重化部114に出力する。
【0103】
このように、本実施の形態の階層符号化装置によれば、中間レイヤの復号信号を予測フィルタに与え、その出力信号を第1レイヤ符号化の適応符号帳の内部状態の更新に用いることにより、中間レイヤまでのスケーラビリティを確保できる。
【0104】
(実施の形態2)
本実施の形態では、実施の形態1の階層符号化装置で符号化された信号を復号する例について説明する。本実施の形態の特徴は、実施の形態1で説明された階層符号化法の符号化コードを復号することができ、その結果高品質な音響信号を復号することが可能になる点にある。
【0105】
図5は、本発明の実施の形態2に係る階層復号化装置の構成を示すブロック図である。図5の階層復号化装置300は、入力端子301と、分離部302と、第1レイヤ復号化部303と、第2レイヤ復号化部304と、第3レイヤ復号化部305と、加算器306と、加算器307と、予測フィルタ308と、出力端子309とから主に構成される。
【0106】
入力端子301から図1の階層符号化装置にて符号化された符号化ビット列が入力される。
【0107】
分離部302は、符号化ビット列を分離し、第1レイヤ符号化で得られる第1符号化コード、第2レイヤ符号化で得られる第2符号化コードおよび第3レイヤ符号化で得られる第3符号化コードを生成する。そして、分離部302は、第1符号化コードを第1レイヤ復号化部303に出力し、第2符号化コードを第2レイヤ復号化部304に出力し、第3符号化コードを第3レイヤ復号化部305に出力する。
【0108】
第1レイヤ復号化部303は、分離部302で得られた第1符号化コードを用いて復号処理を行い、第1レイヤ復号信号を生成する。
【0109】
次に、第2レイヤ復号化部304は、分離部302で得られた第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成する。加算器306では、前述の第1レイヤ復号信号と第2レイヤ復号残差信号とを加算し、第2レイヤ復号信号を生成する。そして、加算器306は、第2レイヤ復号信号を加算器307に出力する。
【0110】
次に、第3レイヤ復号化部305は、分離部302で得られた第3符号化コードを用いて復号処理を行い、第3レイヤ復号残差信号を生成する。加算器307は、前述の第2レイヤ復号信号と第3レイヤ復号残差信号とを加算し、第3レイヤ復号信号を生成する。加算器307は、第3レイヤ復号信号を予測フィルタ308と出力端子309に出力する。
【0111】
予測フィルタ308は、前述した実施の形態1の予測フィルタ116と同様の処理を行い、予測残差信号を生成する。予測フィルタ308で使用する量子化後のLPC係数には、第1レイヤ復号化部で得られる復号LPC係数が用いられる。また、予測フィルタ308で生成される予測残差信号は第1レイヤ復号化部に与えられ、第1レイヤ復号化部に内在する適応符号帳の内部状態の更新に用いられる。
【0112】
この様子を詳細に説明するために、次に第1レイヤ復号化部303について説明する。ここでは、第1レイヤ復号化部303にCELPを用いる場合を例にして説明するが、本発明の要件として第1レイヤ復号化部に適応符号帳が存在する復号化方法であればよく、本発明はCELPに限定されるものではない。
【0113】
図6は、本実施の形態の階層復号化装置の第1レイヤ復号化部の内部構成を示すブロック図である。図6の第1レイヤ復号化部は、CELPの代表的な構成を基にしたときの構成図である。図6において破線枠で囲まれた部分が図5の第1レイヤ復号化部303に相当する。図6において、第1レイヤ復号化部303は、入力端子401と、分離部402と、適応符号帳403と、雑音符号帳404と、ゲイン符号帳405と、乗算器406と、乗算器407と、加算器408と、LPC復号器409と、合成フィルタ410と、出力端子412と、出力端子413と、入力端子414とから主に構成される。
【0114】
分離部402は、入力端子401より入力される第1符号化コードから符号化コードを分離し、適応符号帳403、雑音符号帳404、ゲイン符号帳405およびLPC復号器409に出力する。
【0115】
LPC復号器409は、与えられる符号化コードを用いてLPC係数を復号し、合成フィルタ410と出力端子412に出力する。出力端子412より出力されるLPC係数は、前述した予測フィルタ308にて利用されることになる。
【0116】
次に、適応符号帳403は符号化コードを利用して適応ベクトルq(k)を復号して乗算器406に出力する。雑音符号帳404は、符号化コードを利用して雑音ベクトルc(k)を復号して乗算器407に出力する。
【0117】
ゲイン符号帳405は、符号化コードを利用して適応ベクトルゲインβqおよび雑音ベクトルゲインγqを復号する。そして、乗算器406は適応ベクトルゲインβqを乗算器406に出力し、雑音ベクトルゲインγqを乗算器407に出力する。
【0118】
乗算器406は、適応ベクトルと適応ベクトルゲインを乗じ、加算器408に出力する。乗算器407では雑音ベクトルと雑音ベクトルゲインを乗じ、加算器408に出力する。加算器408は、乗算後の適応ベクトルと雑音ベクトルとの信号を加算して駆動音源信号を生成する。駆動音源信号をex(k)と表すと、駆動音源信号ex(k)は次の式(5)で求められる。
【0119】
【数5】
次に、復号されたLPC係数と駆動音源信号ex(k)を用いて合成フィルタ410にて合成信号syn(k)を次の式(6)に従い生成する。
【0120】
【数6】
ここで、αq(i)は復号されたLPC係数、NPはLPC係数の次数を表す。上記動作で復号された復号信号syn(n)は出力端子413より出力される。
【0121】
上記復号化処理が終了した後に、次のフレーム(もしくはサブフレーム)での復号化処理に備えて、適応符号帳の内部状態を最新の駆動音源信号を用いて更新する。
【0122】
本発明の特徴は上記説明部分にあり、従来の方法では加算器408で求められた駆動音源信号を用いて適応符号帳403の内部状態を更新していたが、本発明では入力端子414から入力される予測フィルタ308の出力信号(予測残差信号)を用いて適応符号帳の内部状態を更新する。
【0123】
このように、本実施の形態の階層復号化装置によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化方法の復号において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから予測残差信号を生成し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で復号することができ、低ビットレートで高品質な信号を復号できる。
【0124】
なお、上記説明では、予測フィルタ308が第3レイヤ復号信号と第1レイヤ符号化部102より得られる量子化後のLPC係数を用いて、予測残差信号を作成し、適応符号帳403は、この予測残差信号を用いて適応符号帳の内部状態を更新しているが、予測フィルタ308が、第2レイヤ復号信号をもちいて予測残差信号を作成してもよい。すなわち、予測残差信号を作成するために必要な復号信号は、第1レイヤ符号化で符号化しきれない残差信号を符号化するレイヤであれば何段目であってもよい。
【0125】
図7は、本発明の実施の形態2に係る階層復号化装置の構成を示すブロック図である。図7において図5と同一の番号が付与されている構成要素については同一の機能を有するものとしてここでは説明を省略する。本実施の形態の特徴は、中間レイヤの復号信号(図7では第2レイヤ復号信号)を予測フィルタ308に与え、予測フィルタ308の出力信号を図6の適応符号帳403の内部状態の更新に用いる点にある。この構成によれば、中間レイヤまでのスケーラビリティを確保できるという特徴がある。
【0126】
加算器306は、前述の第1レイヤ復号信号と第2レイヤ復号残差信号とを加算し、第2レイヤ復号信号を生成する。そして、加算器306は、第2レイヤ復号信号を加算器307と予測フィルタ308に出力する。
【0127】
次に、第3レイヤ復号化部305は、分離部302で得られた第3符号化コードを用いて復号処理を行い、第3レイヤ復号残差信号を生成する。加算器307は、前述の第2レイヤ復号信号と第3レイヤ復号残差信号とを加算し、第3レイヤ復号信号を生成する。加算器307は、第3レイヤ復号信号を出力端子309に出力する。
【0128】
予測フィルタ308は、第1レイヤ復号化部303で生成される量子化後のLPC係数と加算器306で生成される第2レイヤ復号信号とから予測残差信号を生成する。そして、予測フィルタ308で生成される予測残差信号は、第1レイヤ復号化部に与えられ、第1レイヤ復号化部に内在する適応符号帳の内部状態の更新に用いられる。
【0129】
このように、本実施の形態の階層復号化装置によれば、中間レイヤの復号信号を予測フィルタに与え、その出力信号を第1レイヤ復号化の適応符号帳の内部状態の更新に用いることにより、中間レイヤまでのスケーラビリティを確保できる。
【0130】
(実施の形態3)
図8は、本発明の実施の形態3に係る階層符号化装置の構成を示すブロック図である。図8の階層符号化装置500は、入力端子501と、DS1部502と、第1レイヤ符号化部503と、第1レイヤ復号化部504と、US1部505と、DS2部506と、遅延器507と、減算器508と、第2レイヤ符号化部509と、第2レイヤ復号化部510と、加算器511と、US2部512と、遅延器513と、減算器514と、第3レイヤ符号化部515と、第3レイヤ復号化部516と、加算器517と、多重化部518と、出力端子519と、DS3部520と、予測フィルタ521とから主に構成される。
【0131】
図8の階層符号化装置は、上位レイヤの符号化信号を復号し、この復号信号をアップサンプリングした信号と入力音響信号との差分を下位レイヤで符号化する方法に関し、下位レイヤで符号化する信号のサンプリング周波数が上位レイヤで符号化する信号のサンプリング周波数より高い点が図1の階層符号化装置と異なる。
【0132】
本実施の形態では、各レイヤに入力される信号のサンプリング周波数には次の式(7)に示す関係がある点に特徴がある。
【0133】
【数7】
ここで、Fs(n)は第nレイヤの信号のサンプリング周波数を表す。本実施の形態によれば、複数のサンプリング周波数に対応した符号化を行うことが可能となる。
【0134】
入力端子501から、サンプリング周波数Fs(3)の音響信号が入力されDS1部502に与えられる。
【0135】
DS1部502は、入力音響信号をダウンサンプリングし、この入力音響信号のサンプリング周波数をFs(3)からFs(1)に下げる。そして、DS1部502は、サンプリング周波数Fs(1)の入力信号を第1レイヤ符号化部503に出力する。
【0136】
第1レイヤ符号化部503は、過去に生成した駆動音源信号を内部状態として保持している適応符号帳を有し、適応符号帳を用いることで周期性の強い信号を効率的に符号化することができる。第1レイヤ符号化部503は、入力音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。第1レイヤ符号化部503に適用される代表的な方法として符号励信線形予測法(CELP)がある。
【0137】
そして、第1レイヤ符号化部503は、得られた第1符号化コードを第1レイヤ復号化部504及び多重化部518に出力する。第1レイヤ復号化部504は、第1符号化コードを用いて第1レイヤ復号信号を生成し、この第1レイヤ復号信号をUS1部505に出力する。
【0138】
US1部505は、第1レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(1)からFs(2)に上げる。そして、US1部505は、サンプリング周波数Fs(2)の第1レイヤ復号信号を減算器508と加算器511に出力する。
【0139】
次に、入力端子501から入力される音響信号がDS2部506に与えられる。DS2部506は、入力音響信号をダウンサンプリングし、この入力音響信号のサンプリング周波数をFs(3)からFs(2)に下げる。そして、DS2部506は、サンプリング周波数Fs(2)の入力信号を遅延器507に出力する。
【0140】
遅延器507は、入力端子501から入力される音響信号を所定の時間長だけ遅延して減算器508に出力する。すなわち、DS1部502、第1レイヤ符号化部503、第1レイヤ復号化部504、US1部505およびDS2部506にて生じる遅延を補正する役割を持つ。
【0141】
減算器508は、遅延器507の出力信号と前述の第1レイヤ復号信号との差をとり第2レイヤ残差信号を生成する。そして、減算器508は、第2レイヤ残差信号を第2レイヤ符号化部509に出力する。
【0142】
第2レイヤ符号化部509は、第2レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第2符号化コードを決定する。そして、第2レイヤ符号化部509は、第2レイヤ復号化部510と第2符号化コードを多重化部518に出力する。
【0143】
第2レイヤ復号化部510は、第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成し、この第2レイヤ復号残差信号を加算器511に出力する。
【0144】
加算器511は、第1レイヤ復号信号と第2レイヤ復号残差信号の和をとり、第2レイヤ復号信号を生成する。そして、加算器511は、この第2レイヤ復号信号をUS2部512に出力する。
【0145】
US2部512は、第2レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(2)からFs(3)に上げる。そして、US2部512は、サンプリング周波数Fs(3)の第2レイヤ復号信号を減算器514と加算器517に出力する。
【0146】
次に、遅延器513は、入力端子501から入力される音響信号を所定の時間長だけ遅延した後、この音響信号を減算器514に出力する。すなわち、遅延器513は、前段までの符号化部と復号化部で生じる遅延、具体的にはDS1部502からUS2部512までの信号処理で生じる遅延を補正する役割を持つ。
【0147】
減算器514は、遅延器513の出力信号と前述の第2レイヤ復号信号との差をとり第3レイヤ残差信号を生成する。そして、減算器514は、この第3レイヤ残差信号を第3レイヤ符号化部515に出力する。
【0148】
第3レイヤ符号化部515は、第3レイヤ残差信号を聴感的に品質改善が成されるように符号化して第3符号化コードを決定し、この第3符号化コードを第3レイヤ復号化部516と多重化部518に出力する。
【0149】
第3レイヤ復号化部516は、第3符号化コードを用いて復号処理を行い、第3レイヤ復号残差信号を生成し、この第3レイヤ復号残差信号を加算器517に出力する。
【0150】
加算器517は、第2レイヤ復号信号と第3レイヤ復号残差信号の和をとり、第3レイヤ復号信号を生成し、この第3レイヤ復号信号をDS3部520に出力する。
【0151】
多重化部518は、第1符号化コード、第2符号化コードおよび第3符号化コードを所定の手段によって多重化を行い、符号化ビット列を生成する。そして、多重化部518は、この符号化ビット列を出力端子519より出力する。
【0152】
DS3部520は、第3レイヤ復号信号をダウンサンプリングし、この第3レイヤ復号信号のサンプリング周波数をFs(3)からFs(1)に下げる。そして、DS3部520は、サンプリング周波数Fs(1)の第3レイヤ復号信号を予測フィルタ521に出力する。
【0153】
予測フィルタ521は、第3レイヤ復号信号に予測フィルタをかけ、予測残差信号を生成し、この予測残差信号を第1レイヤ符号化部503に出力する。予測フィルタは、第1レイヤ符号化部503で算出された量子化後のLPC係数により構成される。DS3部520から出力される第3レイヤ復号信号をsyn3(k)、予測残差信号をe(k)、量子化後のLPC係数をαq(i)とすると、予測残差信号e(k)は次の式(8)で表される。
【0154】
【数8】
ここで、NPはLPC係数の次数を表す。
【0155】
第1レイヤ符号化部503は、上記説明の動作で求めた予測残差信号を用いて、第1レイヤ符号化部503に内在する適応符号帳の内部状態として利用する。
【0156】
このように、本実施の形態の階層符号化装置によれば、下位レイヤで符号化する信号のサンプリング周波数を上位レイヤで符号化する信号のサンプリング周波数より高くすることにより、様々なサンプリング周波数に対応させて入力信号を符号化することができる。
【0157】
なお、上記説明では、予測フィルタ521が第3レイヤ復号信号と第1レイヤ符号化部503より得られる量子化後のLPC係数を用いて、予測残差信号を作成し、第1レイヤ符号化部503は、この予測残差信号を用いて適応符号帳の内部状態を更新しているが、予測フィルタ521が、第2レイヤ復号信号をもちいて予測残差信号を作成してもよい。すなわち、予測残差信号を作成するために必要な復号信号は、第1レイヤ符号化で符号化しきれない残差信号を符号化するレイヤであれば何段目であってもよい。
【0158】
図9は、本発明の実施の形態3に係る階層符号化装置の構成を示すブロック図である。図9において図8と同一の番号が付与されている構成要素については同一の機能を有するものとしてここでは説明を省略する。本実施の形態の特徴は、中間レイヤの復号信号(図9では第2レイヤ復号信号)を予測フィルタ521に与え、その出力信号を適応符号帳207の内部状態の更新に用いる点にある。この構成によれば、中間レイヤまでのスケーラビリティを確保できるという特徴がある。
【0159】
加算器511は、第1レイヤ復号信号と第2レイヤ復号残差信号の和をとり、第2レイヤ復号信号を生成する。そして、加算器511は、この第2レイヤ復号信号をUS2部512に出力する。
【0160】
US2部512は、第2レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(2)からFs(3)に上げる。そして、US2部512は、サンプリング周波数Fs(3)の第1レイヤ復号信号を減算器514とDS3部520に出力する。
【0161】
DS3部520は、第3レイヤ復号信号をダウンサンプリングし、この第3レイヤ復号信号のサンプリング周波数をFs(3)からFs(1)に下げる。そして、DS3部520は、サンプリング周波数Fs(1)の第3レイヤ復号信号を予測フィルタ521に出力する。
【0162】
予測フィルタ521は、第2レイヤ復号信号に予測フィルタをかけ、予測残差信号を生成し、この予測残差信号を第1レイヤ符号化部503に出力する。
【0163】
第1レイヤ符号化部503は、予測フィルタ521で求めた予測残差信号を用いて、第1レイヤ符号化部503に内在する適応符号帳の内部状態として利用する。第1レイヤ符号化部503は、入力音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。そして、第1レイヤ符号化部503は、得られた第1符号化コードを第1レイヤ復号化部504及び多重化部518に出力する。
【0164】
このように、本実施の形態の階層符号化装置によれば、中間レイヤの復号信号を予測フィルタに与え、その出力信号を第1レイヤ符号化の適応符号帳の内部状態の更新に用いることにより、中間レイヤまでのスケーラビリティを確保できる。
【0165】
(実施の形態4)
本実施の形態では、実施の形態3の階層符号化装置で符号化された信号を復号する例について説明する。本実施の形態の特徴は、実施の形態3で説明された階層符号化法の符号化コードを復号することができ、その結果高品質な音響信号を復号することが可能になる点にある。
【0166】
図10は、本発明の実施の形態4に係る階層復号化装置の構成を示すブロック図である。図10の階層復号化装置600は、入力端子601と、分離部602と、第1レイヤ復号化部603と、US1部604と、加算器605と、第2レイヤ復号化部606と、US2部607と、第3レイヤ復号化部608と、加算器609と、出力端子610と、DS3部611と、予測フィルタ612とから主に構成される。
【0167】
入力端子601から図8の階層符号化装置にて符号化された符号化ビット列が入力される。
【0168】
分離部602は、符号化ビット列を分離し、第1レイヤ符号化で得られる第1符号化コード、第2レイヤ符号化で得られる第2符号化コードおよび第3レイヤ符号化で得られる第3符号化コードを生成する。そして、分離部602は、第1符号化コードを第1レイヤ復号化部603に出力し、第2符号化コードを第2レイヤ復号化部606に出力し、第3符号化コードを第3レイヤ復号化部608に出力する。
【0169】
第1レイヤ復号化部603は、分離部602で得られた第1符号化コードを用いて復号処理を行い、第1レイヤ復号信号を生成する。
【0170】
US1部604は、第1レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(1)からFs(2)に上げる。そして、US1部604は、サンプリング周波数Fs(2)の第1レイヤ復号信号を加算器605に出力する。
【0171】
次に、第2レイヤ復号化部606は、分離部602で得られた第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成する。加算器605では、前述の第1レイヤ復号信号と第2レイヤ復号残差信号とを加算し、第2レイヤ復号信号を生成する。そして、加算器605は、第1レイヤ復号信号と第2レイヤ復号信号をUS2部607に出力する。
【0172】
US2部607は、第2レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(2)からFs(3)に上げる。そして、US2部607は、サンプリング周波数Fs(3)の第2レイヤ復号信号を加算器609に出力する。
【0173】
次に、第3レイヤ復号化部608は、分離部602で得られた第3符号化コードを用いて復号処理を行い、第3レイヤ復号残差信号を生成する。加算器609は、前述の第2レイヤ復号信号と第3レイヤ復号残差信号とを加算し、第3レイヤ復号信号を生成する。加算器609は、第3レイヤ復号信号をDS3部611と出力端子610に出力する。
【0174】
DS3部611は、第3レイヤ復号信号をダウンサンプリングし、この第3レイヤ復号信号のサンプリング周波数をFs(3)からFs(1)に下げる。そして、DS3部611は、サンプリング周波数Fs(1)の第3レイヤ復号信号を予測フィルタ612に出力する。
【0175】
予測フィルタ612は、前述した実施の形態1の予測フィルタ116と同様の処理を行い、予測残差信号を生成する。予測フィルタ612で使用する量子化後のLPC係数には、第1レイヤ復号化部で得られる復号LPC係数が用いられる。また、予測フィルタ612で生成される予測残差信号は第1レイヤ復号化部に与えられ、第1レイヤ復号化部に内在する適応符号帳の内部状態の更新に用いられる。
【0176】
なお、上記説明では、予測フィルタ612が第3レイヤ復号信号と第1レイヤ復号化部603より得られる量子化後のLPC係数を用いて、予測残差信号を作成し、第1レイヤ復号化部603内の適応符号帳は、この予測残差信号を用いて適応符号帳の内部状態を更新しているが、予測フィルタ612が、第2レイヤ復号信号をもちいて予測残差信号を作成してもよい。すなわち、予測残差信号を作成するために必要な復号信号は、第1レイヤ符号化で符号化しきれない残差信号を符号化するレイヤであれば何段目であってもよい。
【0177】
図11は、本発明の実施の形態4に係る階層復号化装置の構成を示すブロック図である。但し、図10と同一の構成となるものについては、図10と同一番号を付し、詳しい説明を省略する。本実施の形態の特徴は、中間レイヤの復号信号(図11では第2レイヤ復号信号)を予測フィルタ612に与え、予測フィルタ612の出力信号を第1レイヤ復号化部603内の適応符号帳の内部状態の更新に用いる点にある。この構成によれば、中間レイヤまでのスケーラビリティを確保できるという特徴がある。
【0178】
加算器605は、前述の第1レイヤ復号信号と第2レイヤ復号残差信号とを加算し、第2レイヤ復号信号を生成する。そして、加算器605は、第2レイヤ復号信号を加算器US2部607とDS3部611に出力する。
【0179】
US2部607は、第2レイヤ復号信号をアップサンプリングし、サンプリング周波数をFs(2)からFs(3)に上げる。そして、US2部607は、サンプリング周波数Fs(3)の第1レイヤ復号信号を加算器609に出力する。
【0180】
DS3部611は、第2レイヤ復号信号をダウンサンプリングし、この第2レイヤ復号信号のサンプリング周波数をFs(2)からFs(1)に下げる。そして、DS3部611は、サンプリング周波数Fs(1)の第2レイヤ復号信号を予測フィルタ612に出力する。
【0181】
このように、本実施の形態の階層復号化装置によれば、中間レイヤの復号信号を予測フィルタに与え、その出力信号を第1レイヤ復号化の適応符号帳の内部状態の更新に用いることにより、中間レイヤまでのスケーラビリティを確保できる。
【0182】
(実施の形態5)
図12は、本発明の実施の形態5に係る階層符号化装置の第1レイヤ符号化部の構成を示すブロック図である。但し、図2と同一の構成となるものについては、図2と同一番号を付し、詳しい説明を省略する。図12の第1レイヤ符号化部は、周期性算出部701と、判定部702と、スイッチ部703と、適応符号帳704と、多重化器705とを具備し、適応符号帳の内部状態を更新する際に、入力音響信号の周期性の強さに応じて入力端子218から入力される予測残差信号を用いるか、もしくは加算器212より出力される駆動音源信号を用いるかのいずれかを選択する点が図2の第1レイヤ符号化部と異なる。
【0183】
周期性算出部701は、入力端子201から入力された音響信号について相関分析などの処理を行い入力音響信号の周期性の強さの度合いを定量化し、この周期性の強さの度合いを判定部702に出力する。
【0184】
判定部702は、周期性の強さの度合いとあらかじめ定められた閾値と比較を行う。そして、判定部702は、周期性の強さの度合いが閾値を超える場合には入力音響信号の周期性は強いとみなし、フラグを「0」として多重化器705に出力する。また、判定部702は、周期性の強さの度合いが閾値以下のとき、入力音響信号の周期性は弱いとみなし、フラグを「1」として多重化器705に出力する。
【0185】
スイッチ部703では、判定部702より得られるフラグに応じ適応符号帳704の内部状態の更新に使用する信号を切り替える。フラグが0の場合には、スイッチ部703は適応符号帳704の内部状態の更新に使用する信号として入力端子218より入力される予測残差信号を用いるようにスイッチを接続する。同様にフラグが1の場合には、スイッチ部703は適応符号帳704の内部状態の更新に使用する信号として加算器212より出力される駆動音源信号を用いるようにスイッチを接続する。
【0186】
適応符号帳704は、過去に生成した駆動音源信号を内部状態として保持し、この内部状態を所望のピッチ周期で繰り返すことにより適応ベクトルを生成する。すなわち、判定部702において入力音響信号の周期性は強いと判定された場合、適応符号帳704は、入力端子218より入力される予測残差信号を用いて内部状態を更新する。また、判定部702において入力音響信号の周期性は弱いと判定された場合、適応符号帳704は、加算器212より出力される駆動音源信号を用いて内部状態を更新する。そして、適応符号帳704は、内部に保持した駆動音源信号を適応ベクトルとして順に乗算器209に出力する。
【0187】
多重化器705は、LPC量子化器203、探索器214、及び判定部702からの信号を多重化して出力端子216から出力する。
【0188】
このように、本実施の形態の階層符号化装置によれば、入力音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより適応符号帳による予測精度が増し性能が向上する。また、本実施の形態の階層符号化装置によれば、入力音響信号の周期性が強くない場合には駆動音源信号を使って適応符号帳の内部状態を更新することにより、非周期的な信号に対する効果を上げることができる。
【0189】
なお、上記説明では、入力音響信号の周期性の強さに基づいて、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定しているが、判定基準は、特に限定されない。
【0190】
例えば、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪を算出して比較してもよい。図13は、本実施の形態の階層符号化装置の動作の一例を示すフロー図である。以下、図13を用いて階層符号化装置の判定動作について説明する。
【0191】
ステップS810において、予測残差信号を用いて適応符号帳の内部状態を更新し、第1レイヤ符号化部の符号化処理を行う。その際の入力音響信号に対する第1レイヤ復号信号の聴感上の歪E1を算出する。
【0192】
ステップS820において、同様に、駆動音源信号を用いて適応符号帳の内部状態を更新し、第1レイヤ符号化部の符号化処理を行う。その際の入力音響信号に対する第1レイヤ復号信号の聴感上の歪E2を算出する。
【0193】
ステップS830では、ステップS810で求めた歪E1とステップS820で求めた歪E2とを比較する。
【0194】
ステップS840にて判定を行い、歪E1の方が歪E2より小さい場合、ステップS850の処理に進む。また、歪E2の方が歪E1より小さい場合にはステップS860の処理に進む。
【0195】
ステップS850では、予測残差信号を用いる方が、効果が大きいと判断し、予測残差信号を使って適応符号帳の内部状態を更新した後に符号化処理を行う。このとき、適応符号帳の更新に予測残差信号を用いたとしてフラグを0にセットする。
【0196】
ステップS860では、駆動音源信号を用いる方が、効果が大きいと判断し、駆動音源信号を使って適応符号帳の内部状態を更新した後に符号化処理を行う。このとき、適応符号帳の更新に駆動音源信号を用いたとしてフラグを1にセットする。
【0197】
ステップS870では、符号化処理により得られた符号化コードとフラグを多重化部にて多重化して出力端子より出力する。
【0198】
このように、本実施の形態の階層符号化装置によれば、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定する際に、予測残差信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪と、駆動音源信号を用いて適応符号帳の内部状態を更新し入力音響信号を実際に符号化して求められる歪を算出して比較し、歪が小さくなる信号を用いて適応符号帳の内部状態を更新することにより、歪の小さくなる信号を常に使って適応符号帳の内部状態を更新することになるので、品質を向上することができる。
【0199】
(実施の形態6)
図14は、本発明の実施の形態6に係る階層復号化装置の第1レイヤ復号化部の構成を示すブロック図である。但し、図6と同一の構成となるものについては、図6と同一番号を付し、詳しい説明を省略する。図14の第1レイヤ復号化部は、入力端子801と、分離部802と、スイッチ部803とを具備し、適応符号帳の内部状態を更新する際に、分離部802より得られるフラグ情報に基づき入力端子801から入力される予測残差信号を用いるか、もしくは加算器408より出力される駆動音源信号を用いるかのいずれかを選択する点が図2の第1レイヤ符号化部と異なる。
【0200】
分離部802は、入力端子401より入力される符号化コードを基に適応符号帳804、雑音符号帳404、ゲイン符号帳405、LPC復号器409で用いられる符号化コードを分離すると共に、適応符号帳804の内部状態の更新に使用する信号の種類を表すフラグ情報を分離する。このフラグ情報は、図12の判定部702から多重化器705に出力される信号である。
【0201】
スイッチ部803は、フラグ情報に応じ適応符号帳804の内部状態の更新に使用する信号を切り替える。フラグが0の場合には、スイッチ部803は適応符号帳804の内部状態の更新に使用する信号として入力端子801より入力される予測残差信号を用いるようにスイッチを接続する。同様にフラグが1の場合には、スイッチ部803は適応符号帳804の内部状態の更新に使用する信号として加算器408より出力される駆動音源信号を用いるようにスイッチを接続する。
【0202】
このように、本実施の形態の階層復号化装置によれば、符号側において入力音響信号の周期性の強さ等に基づいて、予測残差信号もしくは駆動音源信号のいずれを用いて適応符号帳の内部状態を更新するかを判定した結果に基づいて、符号化された音響信号の周期性が強い場合には、高位レイヤの復号信号から求められる予測残差信号を使って適応符号帳の内部状態を更新することにより、階層符号化法の符号化コードを復号することができ、その結果高品質な音響信号を復号することができる。
【0203】
(実施の形態7)
次に、本発明の実施の形態7について、図面を参照して説明する。図15は、本発明の実施の形態7に係る通信装置の構成を示すブロック図である。図15における信号処理装置1503は前述した実施の形態1から実施の形態6に示した音響符号化装置の中の1つによって構成されている点に本実施の形態の特徴がある。
【0204】
図15に示すように、本発明の実施の形態7に係る通信装置1500は、入力装置1501、A/D変換装置1502及びネットワーク1504に接続されている信号処理装置1503を具備している。
【0205】
A/D変換装置1502は、入力装置1501の出力端子に接続されている。信号処理装置1503の入力端子は、A/D変換装置1502の出力端子に接続されている。信号処理装置1503の出力端子はネットワーク1504に接続されている。
【0206】
入力装置1501は、人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置1502に与える。A/D変換装置1502はアナログ信号をディジタル信号に変換して信号処理装置1503に与える。信号処理装置1503は入力されてくるディジタル信号を符号化してコードを生成し、ネットワーク1504に出力する。
【0207】
このように、本発明の実施の形態の通信装置によれば、通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化する音響符号化装置を提供することができる。
【0208】
(実施の形態8)
次に、本発明の実施の形態8について、図面を参照して説明する。図16は、本発明の実施の形態8に係る通信装置の構成を示すブロック図である。図16における信号処理装置1603は前述した実施の形態1から実施の形態6に示した音響復号化装置の中の1つによって構成されている点に本実施の形態の特徴がある。
【0209】
図16に示すように、本発明の実施の形態8に係る通信装置1600は、ネットワーク1601に接続されている受信装置1602、信号処理装置1603、及びD/A変換装置1604及び出力装置1605を具備している。
【0210】
受信装置1602の入力端子は、ネットワーク1601に接続されている。信号処理装置1603の入力端子は、受信装置1602の出力端子に接続されている。D/A変換装置1604の入力端子は、信号処理装置1603の出力端子に接続されている。出力装置1605の入力端子は、D/A変換装置1604の出力端子に接続されている。
【0211】
受信装置1602は、ネットワーク1601からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して信号処理装置1603に与える。信号処理装置1603は、受信装置1602からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置1604に与える。D/A変換装置1604は、信号処理装置1603からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1605に与える。出力装置1605は、電気的信号であるアナログの復号化音響信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
【0212】
このように、本実施の形態の通信装置によれば、通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
【0213】
(実施の形態9)
次に、本発明の実施の形態9について、図面を参照して説明する。図17は、本発明の実施の形態9に係る通信装置の構成を示すブロック図である。本発明の実施の形態9において、図17における信号処理装置1703は、前述した実施の形態1から実施の形態6に示した音響符号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
【0214】
図17に示すように、本発明の実施の形態9に係る通信装置1700は、入力装置1701、A/D変換装置1702、信号処理装置1703、RF変調装置1704及びアンテナ1705を具備している。
【0215】
入力装置1701は人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置1702に与える。A/D変換装置1702はアナログ信号をディジタル信号に変換して信号処理装置1703に与える。信号処理装置1703は入力されてくるディジタル信号を符号化して符号化音響信号を生成し、RF変調装置1704に与える。RF変調装置1704は、符号化音響信号を変調して変調符号化音響信号を生成し、アンテナ1705に与える。アンテナ1705は、変調符号化音響信号を電波として送信する。
【0216】
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化することができる。
【0217】
なお、本発明は、オーディオ信号を用いる送信装置、送信符号化装置又は音響信号符号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0218】
(実施の形態10)
次に、本発明の実施の形態10について、図面を参照して説明する。図18は、本発明の実施の形態10に係る通信装置の構成を示すブロック図である。本発明の実施の形態10において、図18における信号処理装置1803は、前述した実施の形態1から実施の形態6に示した音響復号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
【0219】
図18に示すように、本発明の実施の形態10に係る通信装置1800は、アンテナ1801、RF復調装置1802、信号処理装置1803、D/A変換装置1804及び出力装置1805を具備している。
【0220】
アンテナ1801は、電波としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置1802に与える。RF復調装置1802は、アンテナ1801からの受信符号化音響信号を復調して復調符号化音響信号を生成して信号処理装置1803に与える。
【0221】
信号処理装置1803は、RF復調装置1802からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置1804に与える。D/A変換装置1804は、信号処理装置1803からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1805に与える。出力装置1805は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
【0222】
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
【0223】
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0224】
また、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態では、信号処理装置として行う場合について説明しているが、これに限られるものではなく、この信号処理方法をソフトウェアとして行うことも可能である。
【0225】
例えば、上記信号処理方法を実行するプログラムを予めROM(Read Only Memory)に格納しておき、そのプログラムをCPU(Central Processor Unit)によって動作させるようにしても良い。
【0226】
また、上記信号処理方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのRAM(Random Access memory)に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
【0227】
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0228】
【発明の効果】
以上説明したように、本発明の音響信号の階層符号化方法および階層復号化方法によれば、上位レイヤで符号化しきれない部分を符号化する下位レイヤで符号化する階層符号化において、第2レイヤ以降の符号化信号を復号した信号と、上位レイヤの符号化で得られるLPC係数とから上位レイヤの符号化で発生する残差信号を予測し、この予測した残差信号を用いて上位レイヤの適応符号帳の更新を行うことにより、音響信号の符号化に近い駆動音源を持つ適応符号帳で符号化して低ビットレートで高品質な符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る階層符号化装置の構成を示すブロック図
【図2】本実施の形態の階層符号化装置の第1レイヤ符号化部の内部構成を示すブロック図
【図3】入力音響信号とそれに対応する第1レイヤ復号信号、第2レイヤ復号信号、第3レイヤ復号信号の関係を示す図
【図4】本発明の実施の形態1に係る階層符号化装置の構成を示すブロック図
【図5】本発明の実施の形態2に係る階層復号化装置の構成を示すブロック図
【図6】本実施の形態の階層復号化装置の第1レイヤ復号化部の内部構成を示すブロック図
【図7】本発明の実施の形態2に係る階層復号化装置の構成を示すブロック図
【図8】本発明の実施の形態3に係る階層符号化装置の構成を示すブロック図
【図9】本発明の実施の形態3に係る階層符号化装置の構成を示すブロック図
【図10】本発明の実施の形態4に係る階層復号化装置の構成を示すブロック図
【図11】本発明の実施の形態4に係る階層復号化装置の構成を示すブロック図
【図12】本発明の実施の形態5に係る階層符号化装置の第1レイヤ符号化部の構成を示すブロック図
【図13】本実施の形態の階層符号化装置の動作の一例を示すフロー図
【図14】本発明の実施の形態6に係る階層復号化装置の第1レイヤ復号化部の構成を示すブロック図
【図15】本発明の実施の形態7に係る通信装置の構成を示すブロック図
【図16】本発明の実施の形態8に係る通信装置の構成を示すブロック図
【図17】本発明の実施の形態9に係る通信装置の構成を示すブロック図
【図18】本発明の実施の形態10に係る通信装置の構成を示すブロック図
【符号の説明】
102、503 第1レイヤ符号化部
103、303、504、603 第1レイヤ復号化部
106、509 第2レイヤ符号化部
107、304、510、606 第2レイヤ復号化部
111、305、515 第3レイヤ符号化部
112、516、608 第3レイヤ復号化部
116、308、521、612 予測フィルタ
202 LPC分析器
203 LPC量子化器
204 LPC復号器
205 聴感重みフィルタ
206 聴感重み付き合成フィルタ
207、403、704 適応符号帳
214 探索器
409 LPC復号器
410 合成フィルタ
502 DS1部
505、604 US1部
506 DS2部
512、607 US2部
520、611 DS3部
701 周期性算出部
702 判定部
703、803 スイッチ部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a hierarchical encoding method and a hierarchical decoding method for an audio signal, and more particularly, to a hierarchical encoding method and a hierarchical decoding method suitable for efficiently using an audio signal such as a musical sound signal or an audio signal for compression encoding. About the method of conversion.
[0002]
[Prior art]
An acoustic coding technique for compressing a tone signal or a voice signal at a low bit rate is important for effective use of a transmission path capacity of radio waves and the like and a recording medium in mobile communication. There are G726 and G729 standardized by ITU (International Telecommunication Union) for audio coding for encoding an audio signal. These systems target narrowband signals (300 Hz to 3.4 kHz) and can perform high-quality encoding at 8 kbit / s to 32 kbit / s. In addition, there are ITU G722, G722.1, 3GPP (The 3rd Generation Partnership Project) AMR-WB, and the like as standard systems for wideband signals (50 Hz to 7 kHz). These methods can code a wideband audio signal with high quality at a bit rate of 6.6 kbit / s to 64 kbit / s.
[0003]
An effective method of encoding a speech signal at a low bit rate with high efficiency is CELP (Code Excited Linear Prediction). CELP is based on a model that simulates a human voice generation model by engineering, and passes an excitation signal represented by a random number or a pulse train through a pitch filter corresponding to the strength of the periodicity and a synthesis filter corresponding to the vocal tract characteristics, This is a method of determining an encoding code such that the square error between the output signal and the input signal is minimized under the weighting of auditory characteristics (for example, see Non-Patent Document 1). Many of the recent standard audio coding systems are based on CELP. For example, G729 can perform narrowband signal coding at 8 kbit / s, and AMR-WB can perform wideband signal coding at 6.6 kbit / s to 23.85 kbit / s. Can be encoded.
[0004]
On the other hand, in the case of musical sound encoding for encoding a musical sound signal, a musical sound signal is converted into a frequency domain like a layer III system or an AAC system standardized by MPEG (Moving Picture Expert Group), and the psychoacoustic is used. Transform coding in which coding is performed using a model is general. In these systems, it is known that a signal having a sampling frequency of 44.1 kHz has 64 kbit / s to 96 kbit / s per channel and hardly causes audible deterioration.
[0005]
However, when encoding a signal mainly composed of audio signals and having music or environmental sound superimposed on the background, if the audio encoding method is applied, the effect of the music or environmental sound in the background will cause the signal to be encoded only in the background. In addition, there is a problem that the audio signal is deteriorated and the overall quality is reduced. This is a problem that occurs because the speech coding system is based on a CELP-based system specialized for a speech model. In addition, the signal band that can be supported by the audio coding system is up to 7 kHz at most, and there is a problem that a signal having a higher band than that can not be sufficiently supported due to its configuration.
[0006]
On the other hand, music encoding can perform high-quality encoding on music, so that sufficient quality can be obtained even for audio signals having music and environmental sounds in the background as described above. The band of the target signal can be handled up to the CD quality of about 22 kHz. On the other hand, in order to realize high-quality encoding, it is necessary to use a high bit rate, and if the bit rate is suppressed to about 32 kbit / s, there is a problem that the quality of a decoded signal is greatly reduced. . For this reason, there is a problem that it cannot be used in a communication network having a low transmission rate.
[0007]
Combining these techniques to avoid the problems described above, the input signal is first coded by CELP in the first layer, and then the decoded signal is subtracted from the input signal to obtain a residual signal. A method of transform-encoding a signal in the second and subsequent layers can be considered. In this method, since the first layer uses CELP, the audio signal can be encoded with high quality, and the second layer and the subsequent layers cover the background music and environmental sound that cannot be expressed by the first layer, and the first layer. A signal having a frequency component higher than the frequency band can be efficiently encoded.
[0008]
However, in order to secure sufficient quality when music is input instead of voice, it is necessary to increase the bit allocation to the second and subsequent layers, resulting in a problem that the bit rate increases. This is a problem that arises because a speech-specific coding scheme such as CELP is applied to the first layer. That is, when a music signal is input, the CELP used in the first layer does not have high coding efficiency for music, so an error signal between the input signal and the decoded signal of the first layer (that is, the input signal of the second layer) Power is increased. As a result, it is necessary to allocate many bits to the second and subsequent layers to improve the quality of the final decoded signal.
[0009]
[Non-patent document 1]
"Code-Excited Linear Prediction (CELP): high quality speech at very low bit rates", Proc. ICASSP 85, pp. 937-940, 1985.
[0010]
[Problems to be solved by the invention]
As described above, the conventional apparatus has a problem that it is difficult to perform high-quality encoding at a low bit rate.
[0011]
The present invention has been made in view of such a point, and an object of the present invention is to provide a hierarchical encoding method and a hierarchical decoding method of an audio signal capable of performing high-quality encoding at a low bit rate.
[0012]
[Means for Solving the Problems]
The hierarchical encoding method according to the present invention is a hierarchical encoding method for encoding an input audio signal, decoding a signal encoded in a previous stage, and encoding a difference between the decoded signal and the input signal, wherein Encoding step of encoding an input audio signal in frame units of a second frame, and second encoding of encoding a difference between a signal obtained by decoding a previous encoding result and an input audio signal in one or more stages. A step, a prediction filter step of generating a prediction residual signal from a signal obtained by decoding the encoding result of the second encoding step, and an update for updating a codebook used for encoding based on the prediction of the prediction filter step. It was prepared with a process.
[0013]
In the hierarchical encoding method according to the present invention, the first encoding step performs CELP encoding of the input audio signal, the prediction filter step generates a prediction filter using quantized LPC coefficients, and the updating step includes: The codebook is updated by using a result obtained by passing a signal obtained by decoding the result of encoding by the second encoding means through the prediction filter.
[0014]
According to these methods, in hierarchical coding in which a part that cannot be completely encoded in an upper layer is encoded in a lower layer, a signal obtained by decoding an encoded signal of a second layer or later and a signal obtained by encoding an upper layer By generating a prediction residual signal generated in the encoding of the upper layer from the obtained LPC coefficients and updating the adaptive codebook of the upper layer using the prediction residual signal, it is close to the encoding of the audio signal. Encoding can be performed with an adaptive codebook having a driving excitation, and high-quality encoding can be performed at a low bit rate.
[0015]
The hierarchical encoding method of the present invention includes a down-sampling step of down-sampling an input audio signal, and an up-sampling step of up-sampling a signal obtained by decoding a preceding-stage encoding result, wherein the second encoding step is The difference between the signal obtained by decoding the encoding result of the preceding stage after the upsampling and the input audio signal is encoded in one or more stages.
[0016]
According to this method, the input signal can be encoded corresponding to various sampling frequencies by setting the sampling frequency of the signal to be encoded in the lower layer higher than the sampling frequency of the signal to be encoded in the upper layer. .
[0017]
The hierarchical encoding method of the present invention includes a periodicity calculating step of measuring a periodicity of an input audio signal, and the updating step includes the step of performing the prediction filtering step when the periodicity is equal to or more than a predetermined threshold. Updating the codebook using the prediction residual signal obtained in the prediction, and updating the codebook using any of the driving excitation signals generated when the periodicity is less than a predetermined threshold. did.
[0018]
According to this method, when the periodicity of the input audio signal is strong, the internal code of the adaptive codebook is updated by using the prediction residual signal obtained from the decoded signal of the higher layer, whereby the prediction accuracy by the adaptive codebook is updated. And the performance is improved. In addition, according to the hierarchical coding apparatus of the present embodiment, when the periodicity of the input audio signal is not strong, the internal state of the adaptive codebook is updated using the driving excitation signal, whereby the non-periodic signal is updated. To the effect.
[0019]
The hierarchical coding method according to the present invention is characterized in that the internal state of the adaptive codebook is updated using the prediction residual signal, the distortion obtained by actually coding the input audio signal, and the internal state of the codebook is calculated using the driving excitation signal. And determining whether any of the distortions obtained by actually encoding the input audio signal is small, and the updating step updates the codebook using the signal with the small distortion. .
[0020]
According to this method, when it is determined whether to update the internal state of the adaptive codebook using the prediction residual signal or the driving excitation signal, the internal state of the adaptive codebook is updated using the prediction residual signal. Then, the distortion obtained by actually encoding the input audio signal and the distortion obtained by updating the internal state of the adaptive codebook using the driving excitation signal and actually encoding the input audio signal are calculated and compared. Since the internal state of the adaptive codebook is updated by using a signal having a small value, the internal state of the adaptive codebook is always updated by using a signal having a small distortion, so that the quality can be improved.
[0021]
The hierarchical decoding method of the present invention encodes an input audio signal on the encoding side, decodes a signal encoded in a preceding stage, and decodes a signal obtained by encoding a difference between the decoded signal and the input signal. Wherein a first decoding step of decoding a signal obtained by encoding an input audio signal in frame units of a predetermined length, and a difference between the input audio signal and a signal obtained by decoding the encoding result of the previous stage, is calculated by one step. Or a second decoding step of decoding and adding the signals encoded in a plurality of stages, respectively, and a prediction filter step of generating a prediction residual signal from the decoding results of the first decoding step and the second decoding step. And an update step of updating a codebook used for decoding based on the prediction of the prediction filter step.
[0022]
In the hierarchical decoding method according to the present invention, the first decoding step decodes an input audio signal by a CELP coding method, and the prediction filter step decodes LPC coefficients coded on the coding side. A prediction filter is generated by using the LPC coefficient obtained in step (a), and the updating step updates the codebook using a result obtained by passing the decoding results of the first decoding step and the second decoding step through the prediction filter. I did it.
[0023]
According to these methods, in the decoding of the hierarchical encoding method of encoding in a lower layer that encodes a part that cannot be encoded in an upper layer, a signal obtained by decoding an encoded signal of a second layer or later and a signal of an upper layer By predicting a residual signal generated in the encoding of the upper layer from the LPC coefficient obtained in the encoding and updating the adaptive codebook of the upper layer using the predicted residual signal, the code of the audio signal is obtained. It is possible to decode with an adaptive codebook having a driving excitation close to that of a signal, and to decode a high quality signal at a low bit rate.
[0024]
The hierarchical decoding method according to the present invention includes an up-sampling step of up-sampling a preceding-stage decoding result, an adding step of adding the up-sampled decoding result and a subsequent-stage decoding result, and a down-sampling step of down-sampling the addition result. And the prediction filter step is configured to generate a prediction residual signal from a decoded result after downsampling.
[0025]
According to this method, by making the sampling frequency of the signal to be decoded in the lower layer higher than the sampling frequency of the signal to be decoded in the upper layer, it is possible to decode the signal obtained by encoding the signal corresponding to various sampling frequencies. it can.
[0026]
In the hierarchical decoding method according to the present invention, in the updating step, the adaptive codebook is updated on the encoding side by using any of the prediction residual signal obtained by the prediction of the prediction filter step and the generated excitation signal. The codebook is updated based on the result of the determination.
[0027]
A hierarchical encoding device according to the present invention is a hierarchical encoding device that encodes an input audio signal, decodes a signal encoded in a previous stage, and encodes a difference between the decoded signal and the input signal. Encoding means for encoding the input audio signal in frame units of the same size, and second encoding for encoding the difference between the signal obtained by decoding the encoding result of the previous stage and the input audio signal in one or more stages Means, and prediction filter means for generating a prediction residual signal from a signal obtained by decoding the coding result of the second coding means, wherein the first coding means performs prediction by the prediction filter means. The codebook used for encoding is updated based on the codebook.
[0028]
According to this configuration, a result of determining on the code side whether to update the internal state of the adaptive codebook using either the prediction residual signal or the driving excitation signal based on the strength of the periodicity of the input acoustic signal or the like. In the case where the periodicity of the coded audio signal is strong based on, the internal state of the adaptive codebook is updated by using the prediction residual signal obtained from the decoded signal of the higher layer, so that the hierarchical coding method is performed. Can be decoded, and as a result, a high-quality audio signal can be decoded.
[0029]
In the hierarchical encoding apparatus according to the present invention, the first encoding unit is a unit that performs CELP encoding of an input audio signal, wherein the codebook holds a driving excitation signal generated in the past, and an LPC coefficient obtained from the input audio signal. LPC analysis means for obtaining the input audio signal, and a search means for searching for a drive excitation signal having the smallest difference from the input audio signal, wherein the prediction filter means generates a prediction filter using the quantized LPC coefficients, The first encoding unit updates the codebook using a result obtained by passing a signal obtained by decoding the encoding result of the second encoding unit through the prediction filter.
[0030]
According to this configuration, in hierarchical encoding in which a part that cannot be completely encoded in the upper layer is encoded in the lower layer, a signal obtained by decoding a coded signal in the second and subsequent layers and a signal obtained by encoding the upper layer. By generating a prediction residual signal from the obtained LPC coefficients and updating the adaptive codebook of the upper layer using the predicted residual signal, an adaptive codebook having a driving excitation close to that of audio signal coding is obtained. Encoding can be performed, and high-quality encoding can be performed at a low bit rate.
[0031]
The hierarchical encoding apparatus according to the present invention includes a down-sampling unit that down-samples an input audio signal and outputs the down-sampled audio signal to the first encoding unit or the second encoding unit; An up-sampling unit for performing sampling, wherein the second encoding unit encodes a difference between a signal obtained by decoding an encoding result of a preceding stage after the up-sampling and an input audio signal in one stage or a plurality of stages. Take.
[0032]
According to this configuration, the input signal can be encoded corresponding to various sampling frequencies by setting the sampling frequency of the signal to be encoded in the lower layer higher than the sampling frequency of the signal to be encoded in the upper layer. .
[0033]
In the hierarchical coding apparatus according to the present invention, the first coding unit may update the adaptive codebook using any of the prediction residual signal obtained by the prediction of the prediction filter unit and the generated excitation signal. A configuration including determination means for determination is adopted.
[0034]
The hierarchical encoding device according to the present invention, wherein the first encoding means includes periodicity calculation means for measuring the periodicity of the input audio signal, and wherein the determination means determines that the periodicity is equal to or greater than a predetermined threshold. In some cases, the codebook is updated using the prediction residual signal obtained by the prediction of the prediction filter means, and the codebook is generated using the driving excitation signal generated when the periodicity is less than a predetermined threshold. The configuration for determining whether to update is adopted.
[0035]
According to these configurations, when the periodicity of the input audio signal is strong, the internal state of the adaptive codebook is updated by using the prediction residual signal obtained from the decoded signal of the higher layer, whereby the prediction by the adaptive codebook is performed. Accuracy increases and performance improves. In addition, according to the hierarchical coding apparatus of the present embodiment, when the periodicity of the input audio signal is not strong, the internal state of the adaptive codebook is updated using the driving excitation signal, whereby the non-periodic signal is updated. To the effect.
[0036]
In the hierarchical coding apparatus of the present invention, the determination unit updates the internal state of the adaptive codebook using a prediction residual signal, and uses a distortion obtained by actually coding an input audio signal and a driving excitation signal. The internal state of the adaptive codebook is updated to determine which of the distortions obtained by actually encoding the input audio signal is smaller, and the first encoding unit updates the codebook using the signal with the smaller distortion. A configuration is adopted for making a determination.
[0037]
According to this configuration, when determining whether to update the internal state of the adaptive codebook using the prediction residual signal or the driving excitation signal, the internal state of the adaptive codebook is updated using the prediction residual signal. Then, the distortion obtained by actually encoding the input audio signal and the distortion obtained by updating the internal state of the adaptive codebook using the driving excitation signal and actually encoding the input audio signal are calculated and compared. Since the internal state of the adaptive codebook is updated by using a signal having a small value, the internal state of the adaptive codebook is always updated by using a signal having a small distortion, so that the quality can be improved.
[0038]
A hierarchical decoding device of the present invention encodes an input audio signal on the encoding side, decodes a signal encoded in a previous stage, and decodes a signal obtained by encoding a difference between the decoded signal and the input signal. And a first decoding means for decoding a signal obtained by encoding the input audio signal in frame units of a predetermined length, and a difference between the input audio signal and a signal obtained by decoding the encoding result of the previous stage, by one stage. Or a second decoding means for decoding and adding the signals coded in a plurality of stages, respectively, a prediction filter means for generating a prediction residual signal from decoding results of the first decoding means and the second decoding means, And the decoding unit updates the codebook used for decoding based on the prediction of the prediction filter unit.
[0039]
In the hierarchical decoding device according to the present invention, the first decoding means may decode the input audio signal by a CELP coding method, and the prediction filter means may include an LPC encoded on an encoding side. A prediction filter is generated using LPC coefficients obtained by decoding the coefficients, and the first decoding unit passes a decoding result of the first decoding unit and the second decoding unit through the prediction filter. Is adopted to update the codebook using.
[0040]
According to these configurations, in decoding of the hierarchical encoding method in which the lower layer encodes a portion that cannot be encoded in the upper layer, a signal obtained by decoding the encoded signal of the second layer and the following layers is decoded. By generating a prediction residual signal from the LPC coefficients obtained by encoding and updating the adaptive codebook of the upper layer using the predicted residual signal, a driving excitation similar to that of audio signal encoding is obtained. It can be decoded with an adaptive codebook, and can decode high-quality signals at low bit rates.
[0041]
A hierarchical decoding apparatus according to the present invention includes an up-sampling unit for up-sampling a preceding-stage decoding result, an adding unit for adding the up-sampled decoding result and a subsequent-stage decoding result, and down-sampling the addition result of the adding unit. And a down-sampling unit, wherein the filter unit is configured to generate a prediction residual signal from a decoded result after down-sampling.
[0042]
According to this configuration, by setting the sampling frequency of the signal to be decoded in the lower layer higher than the sampling frequency of the signal to be decoded in the upper layer, it is possible to decode a signal obtained by encoding a signal corresponding to various sampling frequencies. it can.
[0043]
In the hierarchical decoding apparatus according to the present invention, the first decoding means may use an adaptive codebook on the encoding side by using either a prediction residual signal obtained by the prediction of the prediction filter means or a generated excitation signal. The codebook is updated based on the result of determining whether to update the codebook.
[0044]
According to this configuration, it is determined on the code side whether to update the internal state of the adaptive codebook using either the prediction residual signal or the driving excitation signal based on the strength of the periodicity of the input acoustic signal and the like. In the case where the periodicity of the coded audio signal is strong based on, the internal state of the adaptive codebook is updated by using the prediction residual signal obtained from the decoded signal of the higher layer, so that the hierarchical coding method is performed. Can be decoded, and as a result, a high-quality audio signal can be decoded.
[0045]
An audio signal transmitting apparatus according to the present invention includes an audio input unit for converting an audio signal into an electric signal, an A / D conversion unit for converting a signal output from the audio input unit into a digital signal, and an A / D converter. Means for encoding the digital signal output from the means, RF modulation means for modulating the coded code output from the coding apparatus into a radio frequency signal, and output from the RF modulation means. And a transmission antenna that converts a signal into a radio wave and transmits the radio wave.
[0046]
According to this configuration, in hierarchical encoding in which a part that cannot be completely encoded in the upper layer is encoded in the lower layer, a signal obtained by decoding a coded signal in the second and subsequent layers and a signal obtained by encoding the upper layer. By generating a prediction residual signal from the obtained LPC coefficient and updating the adaptive codebook of the upper layer using the predicted residual signal, the adaptive codebook having a driving excitation close to the encoding of the acoustic signal is obtained. Encoding can be performed, and high-quality encoding can be performed at a low bit rate.
[0047]
The acoustic signal receiving apparatus according to the present invention includes a receiving antenna for receiving a radio wave, an RF demodulating means for demodulating a signal received by the receiving antenna, and the hierarchical decoding for decoding information obtained by the RF demodulating means. A D / A converter for converting a signal output from the decoding device into an analog signal, and an audio output unit for converting an electric signal output from the D / A converter into an audio signal. The configuration provided is adopted.
[0048]
According to this configuration, in the decoding of the hierarchical encoding method of encoding in a lower layer that encodes a part that cannot be encoded in an upper layer, a signal obtained by decoding an encoded signal of a second layer or later and a code of an upper layer A prediction residual signal is generated from the LPC coefficients obtained by the coding, and the adaptive codebook of the upper layer is updated using the predicted residual signal. It can decode with a codebook, and can decode a high-quality signal at a low bit rate.
[0049]
The communication terminal device of the present invention employs a configuration including at least one of the above-described acoustic signal transmitting device and the above-described acoustic signal receiving device. The base station apparatus of the present invention employs a configuration including at least one of the above-described acoustic signal transmitting apparatus and the above-described acoustic signal receiving apparatus.
[0050]
According to these configurations, in hierarchical coding in which a part that cannot be completely encoded in the upper layer is encoded in the lower layer, a signal obtained by decoding an encoded signal in the second and subsequent layers and a signal obtained by encoding the upper layer By generating a prediction residual signal from the obtained LPC coefficients and updating the upper layer adaptive codebook using the predicted residual signal, an adaptive codebook having a driving excitation close to that of audio signal coding is obtained. , And high-quality encoding can be performed at a low bit rate.
[0051]
BEST MODE FOR CARRYING OUT THE INVENTION
The gist of the present invention is that, in hierarchical encoding in which a part that cannot be completely encoded in an upper layer is encoded in a lower layer, a signal obtained by decoding an encoded signal of a second layer or later and an encoded signal of an upper layer are obtained. By generating a prediction residual signal from the obtained LPC coefficient and updating the adaptive codebook of the upper layer using the predicted residual signal, the adaptive codebook having a driving excitation close to the encoding of the acoustic signal is obtained. It is to perform high-quality encoding at a low bit rate by encoding.
[0052]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following description of the embodiment, the case where the number of layers N is 3 will be described, but the present invention is not limited to this numerical value, and can be applied to a configuration satisfying the condition of N ≧ 2. .
[0053]
(Embodiment 1)
FIG. 1 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 1 of the present invention. 1 includes an
[0054]
In the present embodiment, the sampling frequencies of the signals input to each layer are all the same, and the sampling frequency is represented by Fs. An audio signal having a sampling frequency Fs is input from an
[0055]
First
[0056]
Then, first
[0057]
The
[0058]
The
[0059]
Second
[0060]
Similarly, a second encoded code is given to second
[0061]
The
[0062]
Next, the
[0063]
The
[0064]
Third
[0065]
Third
[0066]
The
[0067]
The
[0068]
The third layer decoded signal generated by
[0069]
[0070]
(Equation 1)
Here, NP represents the order of the LPC coefficient.
[0071]
First
[0072]
Hereinafter, details of first
[0073]
FIG. 2 is a block diagram showing an internal configuration of the first layer encoding unit of the hierarchical encoding device according to the present embodiment. The first layer coding section in FIG. 2 is a configuration diagram based on a typical configuration of CELP. 2 corresponds to the first
[0074]
An audio signal input from the
[0075]
The LPC quantizer 203 converts the LPC coefficients into parameters suitable for quantization such as LSP coefficients and performs quantization. Then,
[0076]
The
[0077]
The
[0078]
Next, an adaptive vector, an adaptive vector gain, a noise vector, and a configuration part for searching for a noise vector gain will be described.
[0079]
[0080]
The
[0081]
Further, the
[0082]
The
[0083]
The
[0084]
The perceptual
[0085]
The
[0086]
The
[0087]
The
[0088]
(Equation 2)
[Equation 3]
Here, t (k) is a perceptually weighted input signal, pi (k) is a signal obtained by passing an i-th adaptive vector through a perceptually weighted synthesis filter, and ej (k) is a j-th noise vector. The signals obtained through the perceptual weighting synthesis filter, β and γ, represent the adaptive vector gain and the noise vector gain, respectively. Equations (2) and (3) differ in the configuration of the gain codebook. In the case of Equation 2, the gain codebook is expressed as a vector having adaptive vector gain βm and noise vector gain γm as elements. The encoded code m for identification is determined. In the case of Equation 3, the gain codebook has the adaptive vector gain βm and the noise vector gain γn independently, and the encoded codes m and n are determined independently.
[0089]
If the optimization of the adaptive vector, the adaptive vector gain, the noise vector, and the noise vector gain is simultaneously attempted, the amount of calculation becomes enormous, and a countermeasure is required. Generally, a method is adopted in which an optimum vector or value is determined in the order of an adaptive vector, an adaptive vector gain, a noise vector, and a noise vector gain.
[0090]
After the encoding code is determined by the
[0091]
After the above-described encoding process is completed, the internal state of the adaptive codebook is updated in preparation for the encoding process in the next frame (or subframe).
[0092]
The
[0093]
(Equation 4)
Here, NP represents the order of the LPC coefficient.
[0094]
The feature of the present invention lies in the above description. In the conventional method, the internal state of
[0095]
FIG. 3 is a diagram showing the relationship between the input audio signal and the corresponding first layer decoded signal, second layer decoded signal, and third layer decoded signal. In the conventional method, the adaptive codebook is updated using the excitation signal corresponding to the first layer decoded signal.
[0096]
Comparing the decoded signals of the layers, the signal closest to the input audio signal is the third layer decoded signal, and then the second layer decoded signal and the first layer decoded signal. This is because, in the present embodiment, the encoding is performed such that the error between the input audio signal and the decoded signal decreases as the number of layers increases. On the other hand, the performance of the adaptive codebook becomes higher as the internal state of the adaptive codebook becomes more similar to the input audio signal. Therefore, when the internal state of the adaptive codebook is updated using the third layer decoded signal, more efficient encoding can be realized. Since the internal state of the adaptive codebook needs to be a driving excitation signal, in practice, a prediction residual signal is obtained from the third layer decoded signal using LPC coefficients, and an adaptive code is generated using the prediction residual signal. This will update the internal state of the book.
[0097]
As described above, according to the hierarchical encoding device of the present embodiment, in hierarchical encoding in which a part that cannot be completely encoded in an upper layer is encoded in a lower layer, an encoded signal of a second layer or later is decoded. A residual signal generated in the encoding of the upper layer is predicted from the signal thus obtained and the LPC coefficient obtained in the encoding of the upper layer, and the adaptive codebook of the upper layer is updated using the predicted residual signal. Accordingly, it is possible to perform encoding with an adaptive codebook having a driving excitation close to that of encoding an audio signal, and to perform high-quality encoding at a low bit rate.
[0098]
In the above description, the
[0099]
FIG. 4 is a block diagram showing a configuration of the hierarchical encoding device according to Embodiment 1 of the present invention. 4, components having the same reference numerals as those in FIG. 1 have the same functions and will not be described here. A feature of the present embodiment is that a decoded signal of the intermediate layer (the decoded signal of the second layer in FIG. 4) is provided to
[0100]
The
[0101]
The
[0102]
First
[0103]
As described above, according to the hierarchical encoding device of the present embodiment, the decoded signal of the intermediate layer is provided to the prediction filter, and the output signal is used for updating the internal state of the adaptive codebook of the first layer encoding. And scalability up to the intermediate layer.
[0104]
(Embodiment 2)
In the present embodiment, an example in which a signal encoded by the hierarchical encoding device of Embodiment 1 is decoded will be described. A feature of the present embodiment is that the encoded code of the hierarchical encoding method described in the first embodiment can be decoded, and as a result, a high-quality audio signal can be decoded.
[0105]
FIG. 5 is a block diagram showing a configuration of the hierarchical decoding device according to Embodiment 2 of the present invention. 5 includes an
[0106]
A coded bit sequence coded by the hierarchical coding device of FIG. 1 is input from an
[0107]
Separating
[0108]
First
[0109]
Next, second
[0110]
Next, third
[0111]
The
[0112]
In order to describe this state in detail, the first
[0113]
FIG. 6 is a block diagram showing an internal configuration of the first layer decoding unit of the hierarchical decoding device according to the present embodiment. The first layer decoding unit in FIG. 6 is a configuration diagram based on a typical configuration of CELP. In FIG. 6, a portion surrounded by a broken line frame corresponds to first
[0114]
Separating
[0115]
[0116]
Next,
[0117]
The
[0118]
[0119]
(Equation 5)
Next, using the decoded LPC coefficient and the driving excitation signal ex (k), the
[0120]
(Equation 6)
Here, αq (i) represents the decoded LPC coefficient, and NP represents the order of the LPC coefficient. The decoded signal syn (n) decoded by the above operation is output from the
[0121]
After the above-described decoding processing is completed, the internal state of the adaptive codebook is updated using the latest driving excitation signal in preparation for the decoding processing in the next frame (or subframe).
[0122]
The feature of the present invention lies in the above description. In the conventional method, the internal state of
[0123]
As described above, according to the hierarchical decoding device of the present embodiment, in the decoding of the hierarchical encoding method of encoding a part that cannot be completely encoded by the upper layer in the lower layer, the encoding of the second and subsequent layers is performed. By generating a prediction residual signal from the signal obtained by decoding the signal and the LPC coefficient obtained by the encoding of the upper layer, and updating the adaptive codebook of the upper layer using the predicted residual signal, It is possible to decode with an adaptive codebook having a driving excitation similar to signal encoding, and to decode a high-quality signal at a low bit rate.
[0124]
In the above description,
[0125]
FIG. 7 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 2 of the present invention. 7, components having the same reference numerals as those in FIG. 5 have the same functions, and a description thereof will be omitted. A feature of the present embodiment is that the decoded signal of the intermediate layer (the decoded signal of the second layer in FIG. 7) is supplied to
[0126]
The
[0127]
Next, third
[0128]
The
[0129]
Thus, according to the hierarchical decoding apparatus of the present embodiment, the decoded signal of the intermediate layer is provided to the prediction filter, and the output signal is used for updating the internal state of the adaptive codebook of the first layer decoding. And scalability up to the intermediate layer.
[0130]
(Embodiment 3)
FIG. 8 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 3 of the present invention. 8 includes an
[0131]
8 relates to a method of decoding an encoded signal of an upper layer and encoding a difference between a signal obtained by up-sampling the decoded signal and an input audio signal in a lower layer, and encoding in a lower layer. The difference from the hierarchical encoding apparatus of FIG. 1 is that the sampling frequency of the signal is higher than the sampling frequency of the signal to be encoded in the upper layer.
[0132]
The present embodiment is characterized in that the sampling frequency of a signal input to each layer has a relationship represented by the following equation (7).
[0133]
(Equation 7)
Here, Fs (n) represents the sampling frequency of the signal of the n-th layer. According to the present embodiment, it is possible to perform encoding corresponding to a plurality of sampling frequencies.
[0134]
An audio signal of the sampling frequency Fs (3) is input from the
[0135]
The
[0136]
First
[0137]
Then, first
[0138]
US1
[0139]
Next, an acoustic signal input from the
[0140]
The
[0141]
The
[0142]
Second
[0143]
Second
[0144]
The
[0145]
US2
[0146]
Next, the
[0147]
The
[0148]
Third
[0149]
Third
[0150]
[0151]
The
[0152]
[0153]
The
[0154]
(Equation 8)
Here, NP represents the order of the LPC coefficient.
[0155]
The first
[0156]
As described above, according to the hierarchical coding device of the present embodiment, the sampling frequency of a signal to be coded in a lower layer is higher than the sampling frequency of a signal to be coded in a higher layer, thereby supporting various sampling frequencies. Thus, the input signal can be encoded.
[0157]
In the above description, the
[0158]
FIG. 9 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 3 of the present invention. In FIG. 9, components denoted by the same reference numerals as those in FIG. 8 have the same functions and will not be described here. A feature of the present embodiment is that a decoded signal of the intermediate layer (the decoded signal of the second layer in FIG. 9) is provided to
[0159]
The
[0160]
US2
[0161]
[0162]
The
[0163]
The first
[0164]
As described above, according to the hierarchical encoding device of the present embodiment, the decoded signal of the intermediate layer is provided to the prediction filter, and the output signal is used for updating the internal state of the adaptive codebook of the first layer encoding. And scalability up to the intermediate layer.
[0165]
(Embodiment 4)
In the present embodiment, an example will be described in which a signal encoded by the hierarchical encoding device of Embodiment 3 is decoded. A feature of the present embodiment is that the encoded code of the hierarchical encoding method described in the third embodiment can be decoded, and as a result, a high-quality audio signal can be decoded.
[0166]
FIG. 10 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 4 of the present invention. 10 includes an
[0167]
A coded bit sequence coded by the hierarchical coding device of FIG. 8 is input from an
[0168]
Separating
[0169]
First
[0170]
US1
[0171]
Next, second
[0172]
US2
[0173]
Next, third
[0174]
[0175]
The
[0176]
In the above description, the
[0177]
FIG. 11 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 4 of the present invention. However, components having the same configuration as in FIG. 10 are assigned the same reference numerals as in FIG. 10 and detailed descriptions thereof are omitted. A feature of the present embodiment is that a decoded signal of the intermediate layer (a second layer decoded signal in FIG. 11) is provided to
[0178]
The
[0179]
US2
[0180]
[0181]
Thus, according to the hierarchical decoding apparatus of the present embodiment, the decoded signal of the intermediate layer is provided to the prediction filter, and the output signal is used for updating the internal state of the adaptive codebook of the first layer decoding. And scalability up to the intermediate layer.
[0182]
(Embodiment 5)
FIG. 12 is a block diagram showing a configuration of the first layer encoding unit of the hierarchical encoding device according to Embodiment 5 of the present invention. However, components having the same configuration as in FIG. 2 are denoted by the same reference numerals as in FIG. 2 and detailed description is omitted. The first layer encoding unit in FIG. 12 includes a
[0183]
The
[0184]
The
[0185]
The
[0186]
[0187]
The
[0188]
As described above, according to the hierarchical coding apparatus of the present embodiment, when the periodicity of the input audio signal is strong, the internal state of the adaptive codebook is calculated using the prediction residual signal obtained from the decoded signal of the higher layer. Is updated, the prediction accuracy by the adaptive codebook is increased, and the performance is improved. In addition, according to the hierarchical coding apparatus of the present embodiment, when the periodicity of the input audio signal is not strong, the internal state of the adaptive codebook is updated using the driving excitation signal, whereby the non-periodic signal is updated. To the effect.
[0189]
In the above description, whether to update the internal state of the adaptive codebook using the prediction residual signal or the driving excitation signal is determined based on the strength of the periodicity of the input audio signal. The criteria are not particularly limited.
[0190]
For example, the internal state of the adaptive codebook is updated using the prediction residual signal, and the distortion obtained by actually encoding the input audio signal and the internal state of the adaptive codebook are updated using the driving excitation signal to update the input audio signal. May be actually encoded to calculate a distortion that is obtained and then compared. FIG. 13 is a flowchart illustrating an example of the operation of the hierarchical encoding device according to the present embodiment. Hereinafter, the determination operation of the hierarchical encoding device will be described with reference to FIG.
[0191]
In step S810, the internal state of the adaptive codebook is updated using the prediction residual signal, and the encoding process of the first layer encoding unit is performed. At this time, the audible distortion E1 of the first layer decoded signal with respect to the input audio signal is calculated.
[0192]
In step S820, similarly, the internal state of the adaptive codebook is updated using the driving excitation signal, and the encoding process of the first layer encoding unit is performed. The audible distortion E2 of the first layer decoded signal with respect to the input audio signal at that time is calculated.
[0193]
In step S830, the distortion E1 determined in step S810 is compared with the distortion E2 determined in step S820.
[0194]
The determination is made in step S840. If the distortion E1 is smaller than the distortion E2, the process proceeds to step S850. If the distortion E2 is smaller than the distortion E1, the process proceeds to step S860.
[0195]
In step S850, it is determined that using the prediction residual signal is more effective, and the encoding process is performed after updating the internal state of the adaptive codebook using the prediction residual signal. At this time, the flag is set to 0 on the assumption that the prediction residual signal is used for updating the adaptive codebook.
[0196]
In step S860, it is determined that using the driving excitation signal is more effective, and the encoding process is performed after updating the internal state of the adaptive codebook using the driving excitation signal. At this time, the flag is set to 1 on the assumption that the driving excitation signal is used for updating the adaptive codebook.
[0197]
In step S870, the coded code and the flag obtained by the coding process are multiplexed by the multiplexing unit and output from the output terminal.
[0198]
Thus, according to the hierarchical coding apparatus of the present embodiment, when determining whether to update the internal state of the adaptive codebook using either the prediction residual signal or the driving excitation signal, the prediction residual signal Update the internal state of the adaptive codebook using, and actually encode the input audio signal and obtain the distortion, and update the internal state of the adaptive codebook using the drive excitation signal to actually encode the input audio signal By calculating and comparing the required distortion, and updating the internal state of the adaptive codebook using a signal with a small distortion, the internal state of the adaptive codebook is always updated with a signal with a small distortion. Therefore, quality can be improved.
[0199]
(Embodiment 6)
FIG. 14 is a block diagram showing a configuration of the first layer decoding unit of the hierarchical decoding device according to Embodiment 6 of the present invention. However, components having the same configuration as in FIG. 6 are denoted by the same reference numerals as in FIG. 6, and detailed description is omitted. The first layer decoding unit in FIG. 14 includes an
[0200]
Separating
[0201]
[0202]
As described above, according to the hierarchical decoding apparatus of the present embodiment, based on the strength of the periodicity of the input audio signal on the code side, the adaptive codebook using either the prediction residual signal or the driving excitation signal is used. If the encoded audio signal has a strong periodicity based on the result of determining whether to update the internal state of the adaptive codebook, the internal residual of the adaptive codebook is calculated using the prediction residual signal obtained from the decoded signal of the higher layer. By updating the state, the encoded code of the hierarchical encoding method can be decoded, and as a result, a high-quality audio signal can be decoded.
[0203]
(Embodiment 7)
Next, a seventh embodiment of the present invention will be described with reference to the drawings. FIG. 15 is a block diagram showing a configuration of a communication device according to Embodiment 7 of the present invention. A feature of the present embodiment lies in that the
[0204]
As shown in FIG. 15, a communication device 1500 according to Embodiment 7 of the present invention includes an
[0205]
The A /
[0206]
The
[0207]
As described above, according to the communication apparatus of the embodiment of the present invention, it is possible to enjoy the effects shown in the above-described first to sixth embodiments in communication, and to efficiently encode an audio signal with a small number of bits. An encoding device can be provided.
[0208]
(Embodiment 8)
Next, an eighth embodiment of the present invention will be described with reference to the drawings. FIG. 16 is a block diagram showing a configuration of a communication device according to Embodiment 8 of the present invention. A feature of this embodiment lies in that the
[0209]
As shown in FIG. 16, a communication device 1600 according to Embodiment 8 of the present invention includes a
[0210]
The input terminal of the
[0211]
[0212]
As described above, according to the communication device of the present embodiment, it is possible to enjoy the effects shown in the above-described first to sixth embodiments in communication, and to efficiently decode an encoded audio signal with a small number of bits. Therefore, a good acoustic signal can be output.
[0213]
(Embodiment 9)
Next, a ninth embodiment of the present invention will be described with reference to the drawings. FIG. 17 is a block diagram showing a configuration of a communication device according to Embodiment 9 of the present invention. The ninth embodiment of the present invention is different from the ninth embodiment in that the
[0214]
As shown in FIG. 17, a communication device 1700 according to Embodiment 9 of the present invention includes an
[0215]
The
[0216]
As described above, according to the communication apparatus of the present embodiment, it is possible to enjoy the effects shown in the above-described first to sixth embodiments in wireless communication, and to efficiently encode an audio signal with a small number of bits. it can.
[0219]
Note that the present invention can be applied to a transmission device, a transmission encoding device, or an audio signal encoding device that uses an audio signal. Further, the present invention can be applied to a mobile station device or a base station device.
[0218]
(Embodiment 10)
Next, a tenth embodiment of the present invention will be described with reference to the drawings. FIG. 18 is a block diagram showing a configuration of a communication device according to Embodiment 10 of the present invention. In the tenth embodiment of the present invention, the
[0219]
As shown in FIG. 18, a communication device 1800 according to Embodiment 10 of the present invention includes an
[0220]
The
[0221]
The
[0222]
As described above, according to the communication apparatus of the present embodiment, it is possible to enjoy the effects shown in the above-described first to sixth embodiments in wireless communication, and to decode an audio signal efficiently encoded with a small number of bits. Therefore, a good acoustic signal can be output.
[0223]
Note that the present invention can be applied to a receiving device, a receiving decoding device, or an audio signal decoding device that uses an audio signal. Further, the present invention can be applied to a mobile station device or a base station device.
[0224]
Further, the present invention is not limited to the above embodiment, and can be implemented with various modifications. For example, in the above-described embodiment, the case where the processing is performed as a signal processing apparatus is described. However, the present invention is not limited to this, and the signal processing method can be performed as software.
[0225]
For example, a program for executing the signal processing method may be stored in a ROM (Read Only Memory) in advance, and the program may be operated by a CPU (Central Processor Unit).
[0226]
Further, a program for executing the above signal processing method is stored in a computer-readable storage medium, and the program stored in the storage medium is recorded in a RAM (Random Access Memory) of the computer, and the computer is operated according to the program. You may make it do.
[0227]
Note that the present invention can be applied to a receiving device, a receiving decoding device, or an audio signal decoding device that uses an audio signal. Further, the present invention can be applied to a mobile station device or a base station device.
[0228]
【The invention's effect】
As described above, according to the hierarchical encoding method and the hierarchical decoding method for an audio signal of the present invention, in the hierarchical encoding in which a part that cannot be encoded in an upper layer is encoded in a lower layer that encodes the second layer, A residual signal generated in the encoding of the upper layer is predicted from a signal obtained by decoding the encoded signal of the layer and subsequent layers and the LPC coefficient obtained in the encoding of the upper layer. By updating the adaptive codebook described above, it is possible to perform encoding with an adaptive codebook having a driving excitation close to that of encoding an acoustic signal and perform high-quality encoding at a low bit rate.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 1 of the present invention.
FIG. 2 is a block diagram illustrating an internal configuration of a first layer encoding unit of the hierarchical encoding device according to the present embodiment.
FIG. 3 is a diagram showing a relationship between an input audio signal and a corresponding first layer decoded signal, second layer decoded signal, and third layer decoded signal.
FIG. 4 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 1 of the present invention.
FIG. 5 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 2 of the present invention.
FIG. 6 is a block diagram showing an internal configuration of a first layer decoding unit of the hierarchical decoding device according to the present embodiment.
FIG. 7 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 2 of the present invention.
FIG. 8 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 3 of the present invention.
FIG. 9 is a block diagram showing a configuration of a hierarchical encoding device according to Embodiment 3 of the present invention.
FIG. 10 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 4 of the present invention.
FIG. 11 is a block diagram showing a configuration of a hierarchical decoding device according to Embodiment 4 of the present invention.
FIG. 12 is a block diagram showing a configuration of a first layer encoding unit of a hierarchical encoding device according to Embodiment 5 of the present invention.
FIG. 13 is a flowchart showing an example of the operation of the hierarchical encoding device of the present embodiment.
FIG. 14 is a block diagram showing a configuration of a first layer decoding unit of the hierarchical decoding device according to Embodiment 6 of the present invention.
FIG. 15 is a block diagram showing a configuration of a communication device according to a seventh embodiment of the present invention.
FIG. 16 is a block diagram showing a configuration of a communication device according to Embodiment 8 of the present invention.
FIG. 17 is a block diagram showing a configuration of a communication device according to Embodiment 9 of the present invention.
FIG. 18 is a block diagram showing a configuration of a communication device according to a tenth embodiment of the present invention.
[Explanation of symbols]
102, 503 First layer encoding section
103, 303, 504, 603 First layer decoding section
106, 509 Second layer encoding unit
107, 304, 510, 606 Second layer decoding section
111, 305, 515 Third layer coding section
112, 516, 608 Third layer decoding section
116, 308, 521, 612 Prediction filter
202 LPC analyzer
203 LPC quantizer
204 LPC decoder
205 Hearing weight filter
206 A hearing weighted synthesis filter
207, 403, 704 Adaptive codebook
214 Searcher
409 LPC decoder
410 Synthesis filter
502 DS1 section
505, 604 US1
506 DS2 part
512, 607 US2
520, 611 DS3 part
701 Periodicity calculator
702 Judgment unit
703, 803 switch section
Claims (23)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003092581A JP4373693B2 (en) | 2003-03-28 | 2003-03-28 | Hierarchical encoding method and hierarchical decoding method for acoustic signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003092581A JP4373693B2 (en) | 2003-03-28 | 2003-03-28 | Hierarchical encoding method and hierarchical decoding method for acoustic signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004301954A true JP2004301954A (en) | 2004-10-28 |
JP4373693B2 JP4373693B2 (en) | 2009-11-25 |
Family
ID=33405626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003092581A Expired - Lifetime JP4373693B2 (en) | 2003-03-28 | 2003-03-28 | Hierarchical encoding method and hierarchical decoding method for acoustic signals |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4373693B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006118179A1 (en) * | 2005-04-28 | 2006-11-09 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device and audio encoding method |
WO2007105586A1 (en) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | Coding device and coding method |
JP4809370B2 (en) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Adaptive bit allocation in multichannel speech coding. |
JP2013537388A (en) * | 2010-09-14 | 2013-09-30 | サムスン エレクトロニクス カンパニー リミテッド | Multi-layer image encoding and decoding apparatus and method |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
-
2003
- 2003-03-28 JP JP2003092581A patent/JP4373693B2/en not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4809370B2 (en) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Adaptive bit allocation in multichannel speech coding. |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
WO2006118179A1 (en) * | 2005-04-28 | 2006-11-09 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device and audio encoding method |
JP4907522B2 (en) * | 2005-04-28 | 2012-03-28 | パナソニック株式会社 | Speech coding apparatus and speech coding method |
US8428956B2 (en) | 2005-04-28 | 2013-04-23 | Panasonic Corporation | Audio encoding device and audio encoding method |
WO2007105586A1 (en) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | Coding device and coding method |
JP5058152B2 (en) * | 2006-03-10 | 2012-10-24 | パナソニック株式会社 | Encoding apparatus and encoding method |
US8306827B2 (en) | 2006-03-10 | 2012-11-06 | Panasonic Corporation | Coding device and coding method with high layer coding based on lower layer coding results |
JP2013537388A (en) * | 2010-09-14 | 2013-09-30 | サムスン エレクトロニクス カンパニー リミテッド | Multi-layer image encoding and decoding apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP4373693B2 (en) | 2009-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3881943B2 (en) | Acoustic encoding apparatus and acoustic encoding method | |
JP5343098B2 (en) | LPC harmonic vocoder with super frame structure | |
JP4662673B2 (en) | Gain smoothing in wideband speech and audio signal decoders. | |
KR100574031B1 (en) | Speech Synthesis Method and Apparatus and Voice Band Expansion Method and Apparatus | |
JP3881946B2 (en) | Acoustic encoding apparatus and acoustic encoding method | |
JP4958780B2 (en) | Encoding device, decoding device and methods thereof | |
WO2003091989A1 (en) | Coding device, decoding device, coding method, and decoding method | |
CN101006495A (en) | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method | |
JP2002528983A (en) | Enhancing periodicity in wideband signal decoding. | |
WO2004097796A1 (en) | Audio encoding device, audio decoding device, audio encoding method, and audio decoding method | |
CN104123946A (en) | Systemand method for including identifier with packet associated with speech signal | |
JP2009541797A (en) | Vocoder and associated method for transcoding between mixed excitation linear prediction (MELP) vocoders of various speech frame rates | |
JP2003323199A (en) | Device and method for encoding, device and method for decoding | |
JP2004310088A (en) | Half-rate vocoder | |
WO2006046587A1 (en) | Scalable encoding apparatus, scalable decoding apparatus, and methods thereof | |
JPWO2009057327A1 (en) | Encoding device and decoding device | |
JP4445328B2 (en) | Voice / musical sound decoding apparatus and voice / musical sound decoding method | |
KR20000077057A (en) | The method and device of sound synthesis, telephone device and the medium of providing program | |
WO2005066937A1 (en) | Signal decoding apparatus and signal decoding method | |
KR20060131793A (en) | Voice/musical sound encoding device and voice/musical sound encoding method | |
JP4937746B2 (en) | Speech coding apparatus and speech coding method | |
JP2006171751A (en) | Speech coding apparatus and method therefor | |
JP4786183B2 (en) | Speech decoding apparatus, speech decoding method, program, and recording medium | |
JP2004302259A (en) | Hierarchical encoding method and hierarchical decoding method for sound signal | |
JP4373693B2 (en) | Hierarchical encoding method and hierarchical decoding method for acoustic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090811 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090904 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120911 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4373693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130911 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |