JP2005284301A - 復号方法及び装置、並びにプログラム - Google Patents

復号方法及び装置、並びにプログラム Download PDF

Info

Publication number
JP2005284301A
JP2005284301A JP2005125583A JP2005125583A JP2005284301A JP 2005284301 A JP2005284301 A JP 2005284301A JP 2005125583 A JP2005125583 A JP 2005125583A JP 2005125583 A JP2005125583 A JP 2005125583A JP 2005284301 A JP2005284301 A JP 2005284301A
Authority
JP
Japan
Prior art keywords
spectrum
power
decoding
power compensation
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005125583A
Other languages
English (en)
Other versions
JP4297078B2 (ja
Inventor
Shigesuke Higashiyama
恵祐 東山
Shiro Suzuki
志朗 鈴木
Minoru Tsuji
実 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005125583A priority Critical patent/JP4297078B2/ja
Publication of JP2005284301A publication Critical patent/JP2005284301A/ja
Application granted granted Critical
Publication of JP4297078B2 publication Critical patent/JP4297078B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 圧縮率を高めた場合における、時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減する。
【解決手段】 復号装置30において、パワー補整用スペクトル生成合成部37〜37は、量子化精度情報、正規化係数、ゲイン制御情報及びパワー調整情報に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。そして、閾値以下のスペクトルをパワー調整後のパワー補整用スペクトルPCSPで置き換えることにより、又はスペクトルSPにパワー調整後のパワー補整用スペクトルPCSPを足し込むことにより、スペクトルSPのパワー補整を行う。
【選択図】 図3

Description

本発明は、高能率符号化された音響信号や音声信号等のディジタルデータを復号する復号方法及びその装置、並びに復号処理をコンピュータに実行させるプログラムに関する。
従来より、音声等のオーディオ信号を高能率符号化する手法としては、例えば帯域分割符号化(サブバンドコーディング)等に代表される非ブロック化周波数帯域分割方式や、変換符号化等に代表されるブロック化周波数帯域分割方式などが知られている。
非ブロック化周波数帯域分割方式では、時間軸上のオーディオ信号を、ブロック化せずに複数の周波数帯域に分割して符号化を行う。また、ブロック化周波数帯域分割方式では、時間軸上の信号を周波数軸上の信号に変換(スペクトル変換)して複数の周波数帯域に分割して、すなわち、スペクトル変換して得られる係数を所定の周波数帯域毎にまとめて、各帯域毎に符号化を行う。
また、符号化効率をより向上させる手法として、上述の非ブロック化周波数帯域分割方式とブロック化周波数帯域分割方式とを組み合わせた高能率符号化の手法も提案されている。この手法によれば、例えば、帯域分割符号化で帯域分割を行った後、各帯域毎の信号を周波数軸上の信号にスペクトル変換し、このスペクトル変換された各帯域毎に符号化が行われる。
ここで、周波数帯域分割を行う際には、処理が簡単であり、且つ、折り返し歪みが消去されることから、例えば、QMF(Quadrature Mirror Filter)が用いられることが多い。なお、QMFによる周波数帯域分割の詳細については、「1976R.E.Crochiere, Digital coding of speech in subbands, Bell Syst. Tech. J.Vol.55, No.8 1976」等に記載されている。
また、帯域分割を行う手法としてこの他に、例えば、等バンド幅のフィルタ分割手法であるPQF(Polyphase Quadrature Filter)等がある。このPQFの詳細については、「ICASSP 83 BOSTON, Polyphase Quadrature filters - A new subband coding technique, Joseph H. Rothweiler」等に記載されている。
一方、上述したスペクトル変換としては、例えば、入力オーディオ信号を所定単位時間のフレームでブロック化し、ブロック毎に離散フーリエ変換(Discrete Fourier Transformation:DFT)、離散コサイン変換(Discrete Cosine Transformation:DCT)、改良DCT変換(Modified Discrete Cosine Transformation:MDCT)等を行うことで時間軸信号を周波数軸信号に変換するものがある。
なお、MDCTについては、「ICASSP 1987, Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, J.P.Princen, A.B.Bradley, Univ. of Surrey Royal Melbourne Inst. of Tech.」等に、その詳細が記載されている。
このようにフィルタやスペクトル変換によって得られる帯域毎の信号を量子化することにより、量子化雑音が発生する帯域を制御することができ、これによりマスキング効果等の性質を利用して聴覚的により高能率な符号化を行うことができる。また、量子化を行う前に各帯域毎の信号成分を、例えばその帯域における信号成分の絶対値の最大値で正規化するようにすれば、さらに高能率な符号化を行うことができる。
帯域分割を行う際の各周波数帯域の幅は、例えば、人間の聴覚特性を考慮して決定される。すなわち一般的には、例えば、臨界帯域(クリティカルバンド)と呼ばれている、高域ほど幅が広くなるような帯域幅で、オーディオ信号を複数(例えば32バンドなど)の帯域に分割することがある。
また、各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分、或いは各帯域毎に適応的なビット割当(ビットアロケーション)が行われる。すなわち、例えば、MDCT処理されて得られた係数データをビットアロケーションによって符号化する際には、ブロック毎の信号をMDCT処理して得られる各帯域のMDCT係数データに対して、適応的にビット数が割り当てられて符号化が行われる。
ビット割当手法としては、例えば、各帯域毎の信号の大きさに基づいてビット割当を行う手法(以下、適宜第1のビット割当手法という。)や、聴覚マスキングを利用することで各帯域毎に必要な信号対雑音比を得て固定的なビット割当を行う手法(以下、適宜第2のビット割当手法という。)等が知られている。
なお、第1のビット割当手法については、例えば、「Adaptive Transform Coding of Speech Signals, R.Zelinski and P.Noll, IEEE Transactions of Accoustics, Speech and Signal Processing, vol.ASSP-25, No.4, August 1977」等にその詳細が記載されている。
また、第2のビット割当手法については、例えば、「ICASSP 1980, The critical band coder digital encoding of the perceptual requirements of the auditory system, M.A.Kransner MIT」等にその詳細が記載されている。
第1のビット割当手法によれば、量子化雑音スペクトルが平坦となり、雑音エネルギが最小となる。しかしながら、聴感覚的にはマスキング効果が利用されていないために、実際の聴感上の雑音感は最適にはならない。また、第2のビット割当手法では、ある周波数にエネルギが集中する場合、例えば、サイン波等を入力した場合であっても、ビット割当が固定的であるために、特性値がそれほど良い値とはならない。
そこで、ビット割当に使用できる全ビットを、各小ブロック毎に予め定められた固定ビット割当パターン分と、各ブロックの信号の大きさに依存したビット配分を行う分とに分割して使用し、その分割比を入力信号に関係する信号に依存させる、すなわち、例えば、その信号のスペクトルが滑らかなほど固定ビット割当パターン分への分割比率を大きくする高能率符号化装置が提案されている。
この方法によれば、サイン波入力のように特定のスペクトルにエネルギが集中する場合には、そのスペクトルを含むブロックに多くのビットが割り当てられ、これにより全体の信号対雑音特性を飛躍的に改善することができる。一般に、急峻なスペクトル成分を持つ信号に対して人間の聴覚は極めて敏感であるため、上述のようにして信号対雑音特性を改善することは、単に測定上の数値を向上させるばかりでなく、聴感上の音質を改善するのにも有効である。
ビット割当の方法としては、この他にも数多くの方法が提案されており、さらに聴覚に関するモデルが精緻化され、符号化装置の能力が向上すれば、聴覚的な観点からより高能率な符号化が可能となる。
波形信号をスペクトルに変換する方法としてDFTやDCTを使用した場合には、M個のサンプルからなる時間ブロックで変換を行うと、M個の独立な実数データが得られる。しかしながら通常は、時間ブロック(フレーム)間の接続歪みを軽減するために、1つのブロックは両隣のブロックとそれぞれ所定の数M1個のサンプルずつオーバーラップさせて構成されるので、DFTやDCTを利用した符号化方法では、平均して(M−M1)個のサンプルに対してM個の実数データを量子化して符号化することになる。
また、時間軸上の信号をスペクトルに変換する方法としてMDCTを使用した場合には、両隣のブロックとM個ずつオーバーラップさせた2M個のサンプルから、独立なM個の実数データが得られる。したがってこの場合には、平均してM個のサンプルに対してM個の実数データを量子化して符号化することになる。この場合、復号装置においては、上述のようにしてMDCTを用いて得られる符号から、各ブロックにおいて逆変換を施して得られる波形要素を互いに干渉させながら加え合わせることにより、波形信号が再構成される。
一般に、変換のための時間ブロック(フレーム)を長くすることによって、スペクトルの周波数分解能が高まり、特定のスペクトル成分にエネルギが集中する。したがって、両隣のブロックと半分ずつオーバーラップさせて長いブロック長で変換を行い、しかも得られたスペクトル信号の個数が元の時間サンプルの個数に対して増加しないMDCTを使用する場合、DFTやDCTを使用した場合よりも効率のよい符号化を行うことが可能となる。また、隣接するブロック同士に充分長いオーバーラップを持たせることによって、波形信号のブロック間歪みを軽減することもできる。
実際の符号列を構成するに際しては、先ず正規化及び量子化が行われる帯域毎に、量子化を行うときの量子化ステップを表す情報である量子化精度情報と各信号成分を正規化するのに用いた係数を表す情報である正規化係数とを所定のビット数で符号化し、次に正規化及び量子化されたスペクトル信号を符号化する。
ここで、例えば、「IDO/IEC 11172-3:1993(E), 1993」には、帯域によって量子化精度情報を表すビット数が異なるように設定された高能率符号化方式が記述されており、これによれば、高域の帯域ほど量子化精度情報を表すビット数が小さくなるように規格化されている。
図9に、例えばオーディオ信号を周波数帯域分割して符号化する従来の符号化装置100の構成の一例を示す。帯域分割部101は、符号化すべきオーディオ信号を入力し、上述したQMF又はPQF等のフィルタを用いて、このオーディオ信号を例えば4つの周波数帯域の信号に帯域分割する。なお、帯域分割部101でオーディオ信号を帯域分割するときの各帯域(以下、適宜、符号化ユニットという。)の幅は、均一であっても、また臨界帯域幅に合わせるように不均一にしてもよい。また、オーディオ信号は、4つの符号化ユニットに分割されるようになされているが、符号化ユニットの数は、これに限定されるものではない。そして、帯域分割部101は、4つの符号化ユニット(以下、適宜、4つの符号化ユニットそれぞれを、第1〜第4の符号化ユニットという。)に分解された信号を、所定の時間ブロック(フレーム)毎に、ゲイン制御部102〜102に供給する。
ゲイン制御部102〜102は、各ブロック内の信号の振幅に応じてゲイン制御情報を生成し、このゲイン制御情報に基づいてブロック内の信号のゲイン制御を行う。そして、ゲイン制御部102〜102は、ゲイン制御を行った結果得られた第1〜第4の符号化ユニットの信号をスペクトル変換部103〜103に供給すると共に、ゲイン制御情報をマルチプレクサ107に供給する。
スペクトル変換部103〜103は、ゲイン制御された各符号化ユニットの時間軸上の信号に対してMDCT等のスペクトル変換を行って周波数軸上の信号を生成し、この周波数軸上の信号を正規化部104〜104及び量子化精度決定部105に供給する。
正規化部104〜104は、第1〜第4の符号化ユニットの信号それぞれを構成する各信号成分から絶対値が最大のものを抽出し、この値に対応する係数を第1〜第4の符号化ユニットの正規化係数とする。そして、正規化部104〜104は、第1〜第4の符号化ユニットの信号を構成する各信号成分を、第1〜第4の符号化ユニットの正規化係数に対応する値でそれぞれ正規化する(除算する)。したがって、この場合、正規化により得られる被正規化データは、−1.0〜1.0の範囲の値となる。正規化部104〜104は、第1〜第4の符号化ユニットの被正規化データを、それぞれ量子化部106〜106に供給すると共に、第1〜第4の符号化ユニットの正規化係数をマルチプレクサ107に供給する。
量子化精度決定部105は、ゲイン制御部102〜102から供給された第1〜第4の符号化ユニットの信号に基づいて、第1〜第4の符号化ユニットの被正規化データそれぞれを量子化する際の量子化ステップを決定する。そして量子化精度決定部105は、その量子化ステップに対応する第1〜第4の符号化ユニットの量子化精度情報を、量子化部106〜106にそれぞれ供給するとともに、マルチプレクサ107にも供給する。
量子化部106〜106は、第1〜第4の符号化ユニットの被正規化データを、第1〜第4の符号化ユニットの量子化精度情報に対応する量子化ステップでそれぞれ量子化することにより符号化し、その結果得られる第1〜第4の符号化ユニットの量子化係数をマルチプレクサ107に供給する。
マルチプレクサ107は、第1〜第4の符号化ユニットの量子化係数、量子化精度情報、正規化係数及びゲイン制御情報を必要に応じて符号化した後、多重化する。そして、マルチプレクサ107は、多重化の結果得られる符号化データを伝送路を介して伝送し、或いは図示しない記録媒体に記録する。
なお、量子化精度決定部105は、帯域分割して得られた信号に基づいて量子化ステップを決定する他、例えば、正規化データに基づいて量子化ステップを決定したり、また、マスキング効果等の聴覚現象を考慮して量子化ステップを決定したりすることができる。
以上のような構成を備える符号化装置100から出力される符号化データを復号する復号装置の構成の一例を図10に示す。図10に示す復号装置120において、デマルチプレクサ121は、入力した符号化データを復号し、第1〜第4の符号化ユニットの量子化係数、量子化精度情報、正規化係数及びゲイン制御情報に分離する。そしてデマルチプレクサ121は、第1〜第4の符号化ユニットの量子化係数、量子化精度情報及び正規化係数を、それぞれの符号化ユニットに対応する信号成分構成部122〜122に供給すると共に、第1〜第4の符号化ユニットのゲイン制御情報を、それぞれの符号化ユニットに対応するゲイン制御部124〜124に供給する。
信号成分構成部122は、第1の符号化ユニットの量子化係数を、第1の符号化ユニットの量子化精度情報に対応した量子化ステップで逆量子化し、第1の符号化ユニットの被正規化データを生成する。さらに、信号成分構成部122は、第1の符号化ユニットの被正規化データに、第1の符号化ユニットの正規化係数に対応する値を乗算して復号し、得られた第1の符号化ユニットの信号をスペクトル逆変換部123に供給する。
信号成分構成部122〜122も同様の処理を行って第2〜第4の符号化ユニットの信号を復号し、これらの信号をスペクトル逆変換部123〜123に供給する。
スペクトル逆変換部123〜123は、復号された周波数軸上の信号に対してIMDCT(Inverse MDCT)等のスペクトル逆変換を行って時間軸上の信号を生成し、この時間軸上の信号をゲイン制御部124〜124に供給する。
ゲイン制御部124〜124は、デマルチプレクサ121から供給されたゲイン制御情報に基づいてゲイン制御補整処理を行い、得られた第1〜第4の符号化ユニットの信号を帯域合成部125に供給する。
帯域合成部125は、ゲイン制御部124〜124から供給された第1〜第4の符号化ユニットの信号を帯域合成し、これにより元のオーディオ信号を復元する。
ところで、図9の符号化装置100から図10の復号装置120に供給(伝送)される符号化データには、量子化精度情報が含まれているため、復号装置120において使われる聴覚モデルは任意に設定することができる。すなわち、符号化装置100において各符号化ユニットに対する量子化ステップを自由に設定することができ、符号化装置100の演算能力の向上や聴覚モデルの精緻化に伴って、復号装置120を変更することなく音質の改善や圧縮率の向上を図ることができる。
しかしながらこの場合、量子化精度情報そのものを符号化するためのビット数が大きくなり、全体の符号化効率をある値以上に向上させるのが困難であった。
そこで、量子化精度情報を直接符号化する代わりに、復号装置において、例えば正規化情報から量子化精度情報を決定する方法があるが、この方法では、規格を決定した時点で正規化係数と量子化精度情報の関係が決まってしまうため、将来的にさらに高度な聴覚モデルに基づいた量子化精度の制御を導入することが困難になるという問題がある。また、実現する圧縮率に幅がある場合には、圧縮率毎に正規化係数と量子化精度情報との関係を定める必要が生じる。
したがって、圧縮率をある値からさらに向上させるには、直接の符号化対象である主情報、例えば図9におけるオーディオ信号の符号化効率を高めるだけでなく、量子化精度情報や正規化係数等の、直接の符号化対象ではない副情報の符号化効率を高めることが必要となってくる。
そこで、本件発明者らは、下記特許文献1,2において、このような副情報の符号化効率を高める技術を提案している。また、本件発明者らは、下記特許文献3において、ゲイン制御を行う符号化方式おけるゲイン情報の符号化効率を高める技術を提案している。これらの技術によれば、例えば各種相関等を利用して可変長符号化を行う等の手法を用いることにより、副情報の符号化効率を高めることができる。
国際公開第2002/052732号パンフレット 特開2002−372995号公報 国際公開第2002/103683号パンフレット
しかしながら、非常に高い圧縮率が要求される場合、符号化装置に与えられたビット数では量子化雑音を知覚しにくいような量子化精度を保つことができないことがある。このような場合、符号化装置は、主情報へのビット配分を減らす処置を施すことが多い。具体的には、主情報である被正規化データ(スペクトル)を0又は小さい値に置き換えたり、量子化を行う帯域幅を狭めたりといった処置を施す。
この結果、復号された処理音は、時間的に帯域変動が起こることによる異音やノイズ、また、スペクトルを0又は小さい値に置き換えることによるパワー感の欠如といった問題が発生する。特に圧縮率を大幅に高めた場合には、これらは大きく知覚されることとなり、聴感上の大きな問題となる。
本発明は、このような従来の実情に鑑みて提案されたものであり、圧縮率を高めた場合における、時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減することが可能な復号方法及びその装置、並びに復号処理をコンピュータに実行させるプログラムを提供することを目的とする。
本発明に係る復号方法は、上述した目的を達成するために、ディジタル信号をスペクトル変換して正規化及び量子化を行い、上記正規化に用いた正規化係数及び上記量子化に用いた量子化精度情報と共に符号化されたスペクトルを復号する復号方法において、上記量子化精度情報及び上記正規化係数を復号し、逆量子化及び逆正規化を行って上記スペクトルを復号するスペクトル復号工程と、パワー補整用スペクトルを生成するパワー補整用スペクトル生成工程と、生成された上記パワー補整用スペクトルのパワーを調整するパワー調整工程と、上記パワー調整工程にてパワー調整された上記パワー補整用スペクトルと、上記スペクトル復号工程にて復号された上記スペクトルとを合成する合成工程とを有し、上記パワー調整工程では、上記スペクトル復号工程にて復号された上記量子化精度情報に基づいて上記パワー補整用スペクトルのパワーを調整する。
また、本発明に係る復号装置は、上述した目的を達成するために、ディジタル信号をスペクトル変換して正規化及び量子化を行い、上記正規化に用いた正規化係数及び上記量子化に用いた量子化精度情報と共に符号化されたスペクトルを復号する復号装置において、上記量子化精度情報及び上記正規化係数を復号し、逆量子化及び逆正規化を行って上記スペクトルを復号するスペクトル復号手段と、パワー補整用スペクトルを生成するパワー補整用スペクトル生成手段と、生成された上記パワー補整用スペクトルのパワーを調整するパワー調整手段と、上記パワー調整手段によってパワー調整された上記パワー補整用スペクトルと、上記スペクトル復号手段によって復号された上記スペクトルとを合成する合成手段とを備え、上記パワー調整手段は、上記スペクトル復号手段によって復号された上記量子化精度情報に基づいて上記パワー補整用スペクトルのパワーを調整する。
このような復号方法及びその装置では、量子化精度情報に基づいてパワー補整用スペクトルのパワー調整を行った後、パワー調整後のパワー補整用スペクトルとスペクトルとを合成する。
また、本発明に係るプログラムは、上述した復号処理をコンピュータに実行させるものである。
本発明に係る復号方法及びその装置、並びにプログラムによれば、圧縮率を高めた場合であっても、時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、高能率符号化されたオーディオ信号等のディジタルデータを復号する復号方法及びその装置に適用したものである。
本実施の形態の基本概念を図1のフローチャートを用いて説明する。先ずステップS1において、スペクトル信号SPを復号する。なお、このスペクトル信号SPは、圧縮率を高めた場合にスペクトル信号が抜け落ちることによる時間的な帯域変動が原因となり異音やノイズが生じ、或いはパワー感が欠如する可能性のあるものとする。
次にステップS2において、パワー補整用スペクトルPCSPを生成し、続くステップS3において、スペクトル信号SPとパワー補整用スペクトルPCSPとを合成したスペクトル信号を生成する。
すなわち、本実施の形態の説明に供する符号化装置及びその方法、並びに本実施の形態における復号装置及びその方法は、パワー補整用スペクトルPCSPを生成してスペクトル信号SPと合成するものであり、これにより、圧縮率を高めた場合における時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減することができる。
以下では、先ず図2を用いて、本実施の形態の説明に供する符号化装置10の概略構成について説明する。図2において帯域分割部11は、符号化すべきオーディオ信号を入力し、QMF(Quadrature Mirror Filter)又はPQF(Polyphase Quadrature Filter)等のフィルタを用いて、このオーディオ信号を例えば4つの周波数帯域の信号に帯域分割する。なお、帯域分割部11でオーディオ信号を帯域分割するときの各帯域(以下、適宜、符号化ユニットという。)の幅は、均一であっても、また臨界帯域幅に合わせるように不均一にしてもよい。また、オーディオ信号は、4つの符号化ユニットに分割されるようになされているが、符号化ユニットの数は、これに限定されるものではない。帯域分割部11は、4つの符号化ユニット(以下、適宜、4つの符号化ユニットそれぞれを、第1〜第4の符号化ユニットという。)に分解された信号を、所定の時間ブロック(フレーム)毎に、ゲイン制御部12〜12に供給する。
ゲイン制御部12〜12は、各ブロック内の信号の振幅に応じてゲイン制御情報を生成し、このゲイン制御情報に基づいてブロック内の信号のゲイン制御を行う。そしてゲイン制御部12〜12は、ゲイン制御を行った結果得られた第1〜第4の符号化ユニットの信号をスペクトル変換部14〜14に供給すると共に、ゲイン制御情報をゲイン制御情報符号化部13に供給する。
ゲイン制御情報符号化部13は、ゲイン制御部12〜12から供給されたゲイン制御情報を符号化してマルチプレクサ22に供給する。ここで、ゲイン制御情報を符号化する際には、前述した特許文献3に記載されている技術を用いることができる。すなわち、隣の符号化ユニット間等における各種相関を利用して可変長符号化を行うことで、ゲイン制御情報の符号化効率を高めることができる。
スペクトル変換部14〜14は、ゲイン制御部12〜12から供給された時間軸上の信号に対してMDCT(Modified Discrete Cosine Transformation)等のスペクトル変換を行って周波数軸上のスペクトルSPを生成し、このスペクトルSPを正規化部15〜15及び量子化精度決定部19に供給する。
正規化部15〜15は、第1〜第4の符号化ユニットのスペクトルSPそれぞれを構成する各信号成分から絶対値が最大のものを抽出し、この値に対応する係数を第1〜第4の符号化ユニットの正規化係数とする。そして、正規化部15〜15は、第1〜第4の符号化ユニットのスペクトルSPを構成する各信号成分を、第1〜第4の符号化ユニットの正規化係数に対応する値でそれぞれ正規化する(除算する)。したがって、この場合、正規化により得られる被正規化データは、−1.0〜1.0の範囲の値となる。正規化部15〜15は、第1〜第4の符号化ユニットの被正規化データを、それぞれパワー調整情報決定部17〜17及び量子化部20〜20に供給すると共に、第1〜第4の符号化ユニットの正規化係数を正規化係数符号化部16に供給する。
正規化係数符号化部16は、正規化部15〜15から供給された正規化係数を符号化してマルチプレクサ22に供給する。この正規化係数の符号化手法としては、例えば前述した特許文献1,3に記載された技術を用いることができる。すなわち、隣の符号化ユニット間、隣のチャネル間、隣の時刻間における各種相関を利用して可変長符号化を行ったり、概形情報を量子化し、その量子化誤差を可変長符号化したりすることにより、正規化係数の符号化効率を高めることができる。
パワー調整情報決定部17〜17は、復号側において後述するパワー補整用スペクトルPCSPのパワー調整を行うためのパワー調整情報を決定する。ここで、原音の状態でスペクトルが抜けていたり値が0であったりする場合には、復号側においてスペクトルSPにパワー補整用スペクトルPCSPを合成すると、本来スペクトルが存在しないところにスペクトルが発生してしまうため、好ましくない。特にトーン性の信号の場合には、パワー補整用スペクトルPCSPによる補整量は少ないことが望ましい。
そこで、例えばトーナリティが所定の閾値よりも高いトーン性信号のように、原音の状態でスペクトルが抜けていたり値が0であったりする場合には、パワー補整スペクトルPCSPを小さく抑えるか0にし、トーナリティが所定の閾値よりも低いノイズ性信号のように、原音のスペクトルがノイズ性である場合には、パワー補整用スペクトルPCSPを大きい値で生成するというように、入力信号のトーナリティに基づいてパワー調整情報を決定し、符号化側でパワー補整用スペクトルPCSPのパワーを制御する。
なお、パワー調整情報によるパワー補整用スペクトルPCSPの制御手法や制御幅には種々あるが、例えばパワー調整情報を1ビットで表現する場合には、トーン性信号ではパワー制御を行わず、ノイズ性信号ではパワー制御を行うといった制御が可能である。また、例えばパワー調整情報を4ビットで表現する場合には、パワー調整情報が0ではパワー補整用スペクトルPCSPのパワーを0にし、それ以外の値ではその値に応じてパワー補整スペクトルPCSPのパワーを、例えば1dBステップ刻みで15dB幅の調整をするといったことが可能である。
パワー調整情報符号化部18は、パワー調整情報決定部17〜17から供給されたパワー調整情報を符号化してマルチプレクサ22に供給する。なお、パワー補整スペクトルの生成及び合成は、後述するように符号化ユニット毎に行われるため、パワー調整情報の符号化についても各符号化ユニット毎に行うようにしてもよいが、符号化ユニットを複数まとめてグループ化した帯域毎にパワー調整情報を生成するようにしても構わない。これは、一般に信号のトーナリティは、細かい帯域毎にはあまり変動せず、ある程度まとまった帯域毎にトーナリティの値が共通化できる場合が多いためである。
ここで、人間の聴覚は、低域の信号に対して敏感であるため、低い周波数帯域(例えば、350Hz以下)ではパワー補整用スペクトルPCSPによるスペクトルSPのパワー補整量をなるべく少なくする、或いは全く行わないようにすることが望ましい。また、ある周波数より低い周波数帯域ではパワー調整スペクトルPCSPによるスペクトルSPのパワー補整を行わないような場合には、その帯域に対するパワー調整情報を符号化する必要はない。
量子化精度決定部19は、スペクトル変換部14〜14から供給された第1〜第4の符号化ユニットのスペクトルSPに基づいて、第1〜第4の符号化ユニットの被正規化データそれぞれを量子化する際の量子化ステップを決定する。そして量子化精度決定部19は、その量子化ステップに対応する第1〜第4の符号化ユニットの量子化精度情報を量子化部20〜20にそれぞれ供給するとともに、量子化精度情報符号化部21にも供給する。
量子化部20〜20は、第1〜第4の符号化ユニットの被正規化データを、第1〜第4の符号化ユニットの量子化精度情報に対応する量子化ステップでそれぞれ量子化することにより符号化し、その結果得られる第1〜第4の符号化ユニットの量子化係数をマルチプレクサ22に供給する。
量子化精度情報符号化部21は、量子化精度決定部19から供給された量子化精度情報を符号化してマルチプレクサ22に供給する。なお、この量子化精度情報の符号化手法としても、前述した特許文献1,3に記載された技術を用いることができる。
マルチプレクサ22は、第1〜第4の符号化ユニットの量子化係数を、ゲイン制御情報、量子化精度情報、正規化情報及びパワー調整情報と共に多重化する。そして、マルチプレクサ22は、多重化の結果得られる符号化データを伝送路を介して伝送し、或いは図示しない記録媒体に記録する。
以上のように、本実施の形態の説明に供する符号化装置10は、復号側においてスペクトルSPと合成されるパワー補整用スペクトルPCSPのパワー調整を行うためのパワー調整情報を生成し、これをスペクトルと共に符号化して伝送路を介して伝送し、又は図示しない記録媒体に記録する。
続いて図3を用いて、符号化装置10から出力される符号化データを復号する本実施の形態における復号装置30の概略構成を説明する。図3において、デマルチプレクサ31は、入力した符号化データを復号し、第1〜第4の符号化ユニットの量子化係数、量子化精度情報符号化データ、正規化情報符号化データ、ゲイン制御情報符号化データ及びパワー調整情報符号化データに分離する。そしてデマルチプレクサ31は、第1〜第4の符号化ユニットの量子化係数を、それぞれの符号化ユニットに対応する信号成分構成部34〜34に供給する。また、デマルチプレクサ31は、第1〜第4の符号化ユニットの量子化精度情報符号化データ、正規化情報符号化データ、ゲイン制御情報符号化データ及びパワー調整情報符号化データを、それぞれ量子化精度情報復号部32、正規化情報復号部33、ゲイン制御情報復号部35及びパワー調整情報復号部36に供給する。
量子化精度情報復号部32は、量子化精度情報符号化データを復号し、復号した量子化精度情報を、それぞれの符号化ユニットに対応する信号成分構成部34〜34及びパワー補整用スペクトル生成合成部37〜37に供給する。
正規化情報復号部33は、正規化情報符号化データを復号し、復号した正規化係数を、それぞれの符号化ユニットに対応する信号成分構成部34〜34及びパワー補整用スペクトル生成合成部37〜37に供給する。
信号成分構成部34は、第1の符号化ユニットの量子化係数を、第1の符号化ユニットの量子化精度情報に対応した量子化ステップで逆量子化し、第1の符号化ユニットの被正規化データを生成する。また、信号成分構成部34は、第1の符号化ユニットの被正規化データに、第1の符号化ユニットの正規化情報に対応する値を乗算して復号し、得られた第1の符号化ユニットのスペクトルSPをパワー補整用スペクトル生成合成部37に供給する。
信号成分構成部34〜34も同様の処理を行って第2〜第4の符号化ユニットのスペクトルSPに復号し、これらのスペクトルSPをパワー補整用スペクトル生成合成部37〜37に供給する。
ゲイン制御情報復号部35は、ゲイン制御情報符号化データを復号し、復号したゲイン制御情報を、それぞれの符号化ユニットに対応するパワー補整用スペクトル生成合成部37〜37及びゲイン制御部39〜39に供給する。
パワー調整情報復号部36は、パワー調整情報符号化データを復号し、復号したパワー調整情報を、それぞれの符号化ユニットに対応するパワー補整用スペクトル生成合成部37〜37に供給する。
パワー補整用スペクトル生成合成部37〜37は、パワー補整用スペクトルPCSPを生成すると共に、量子化精度情報、正規化係数、ゲイン制御情報及びパワー調整情報に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。そして、パワー調整後のパワー補整用スペクトルPCSPをスペクトルSPと合成することにより、スペクトルSPのパワー補整を行う。なお、このパワー補整用スペクトルPCSPの生成手法及びスペクトルSPとの合成手法についての詳細は後述する。
スペクトル逆変換部38〜38は、パワー補整用スペクトル生成合成部37〜37から供給された、補整されたスペクトルに対してIMDCT(Inverse MDCT)等のスペクトル逆変換を行って時間軸上の信号を生成し、この時間軸上の信号をゲイン制御部39〜39に供給する。
ゲイン制御部39〜39は、ゲイン制御情報復号部35から供給されたゲイン制御情報に基づいて第1〜第4の符号化ユニットの信号に対してゲイン制御補整処理を行い、得られた第1〜第4の符号化ユニットの信号を帯域合成部40に供給する。
帯域合成部40は、ゲイン制御部39〜39から供給された第1〜第4の符号化ユニットの信号を帯域合成し、これにより元のオーディオ信号を復元する。
以上のように、本実施の形態における復号装置30は、符号化データに含まれる量子化精度情報、正規化係数、ゲイン制御情報及びパワー調整情報に基づいてパワー補整用スペクトルPCSPのパワー調整を行い、パワー調整後のパワー補整用スペクトルPCSPをスペクトルSPと合成する。これにより、圧縮率を高めた場合であっても、時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減することができる。
そこで以下では、このパワー補整用スペクトルPCSPの生成及びパワー調整処理の一例について図4のフローチャートを用いて詳細に説明する。先ずステップS10において、パワー補整用スペクトルテーブルからパワー補整用スペクトルPCSPを生成する。
ここで、パワー補整用スペクトルテーブルとしては、例えば、ガウシアン分布数値列のようなランダムなものを用いてもよく、また、実際の様々なノイズ性スペクトルから予め学習して作成したものを用いてもよい。なお、パワー補整用スペクトルテーブルは1つに限定されるものではなく、複数用意してその中から選択して用いるようにしても構わない。
パワー補整用スペクトルPCSPを生成する際には、このパワー補整用スペクトルテーブルから符号化ユニット内のスペクトル本数分だけ値を参照する。この際、時間的に連続して同じポイントを参照すると聴感上悪影響を及ぼす虞があるため、時間的にランダムに選択するようにする。具体的には、ランダム生起関数を用いてランダムに選択してもよいが、毎回同一のパワー補整用スペクトルPCSPが生成されることを防止するために、時間的にランダムになるような他のパラメータ、例えば正規化係数や量子化精度情報等を用いてランダムに選択することが好ましい。
以下の説明では、このようなパラメータの一例として、正規化係数のインデックス値を全て加算した値を用いる。但し、パワー補整用スペクトルテーブルのサイズを例えば1024としたとき、正規化係数のインデックス値の加算値が1024を超える場合には、その下位10ビットの値を用いる。
なお、各符号化ユニットで同じ参照ポイントを参照するのではなく、ある符号化ユニットの中のスペクトル本数が16本である場合には、その次の符号化ユニットでは、例えば最初に参照したポイントから16だけ移動したポイントを参照するようにして、同じ参照ポイントを連続して参照しないようにするとよい。
次にステップS11において、正規化係数に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。具体的には、例えばパワー補整用スペクトルPCSPのパワーの最大値が正規化係数の値になるように調整する。
続いてステップS12において、量子化精度情報の値に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。この際、量子化精度が高い場合にはパワー補整用スペクトルPCSPによる補整がなるべく行われず、量子化精度が低い場合には積極的にパワー補整用スペクトルPCSPによる補整を行うように、パワー補整用スペクトルPCSPのパワー調整を行う。具体的には、例えばパワー補整用スペクトルPCSPを量子化精度情報の値で除算するようにしてもよく、また、パワー補整用スペクトルPCSPを2の(量子化精度情報値)乗で除算するようにしてもよい。
ステップS13では、パワー調整情報の値に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。これは、例えば原音の状態でスペクトルが抜けているために敢えて符号化しなかった、或いは値を0にしている場合に、パワー補整用スペクトルPCSPを合成することによって、本来スペクトルが存在しないところにスペクトルを発生させてしまうのを防ぐためである。
次にステップS14では、ゲイン制御情報があるか否かが判別される。ステップS14においてゲイン制御情報がある場合(Yes)には、ステップS15に進み、ゲイン制御情報がない場合(No)には、パワー補整用スペクトルPCSPの生成及びパワー調整処理を終了する。
ステップS15では、ゲイン制御情報の値に基づいてパワー補整用スペクトルPCSPのパワー調整を行う。これは、ゲイン制御によりスペクトルのゲインが上げられる場合にパワー補整用スペクトルPCSP成分についても同時にゲインが上げられ、パワー補整用スペクトルPCSPによるパワー補整量が過度になってしまうことを防止するためである。具体的には、例えばパワー補整用スペクトルPCSPをゲイン制御情報の最大値で除算する。
以上のようにしてパワー補整用スペクトルPCSPの生成及びパワー調整処理が行われる。なお、上述した正規化係数、量子化精度情報及びゲイン制御情報は、スペクトルSPのために符号化された値であり、パワー補整用スペクトルPCSPのために他の正規化係数等を符号化する必要はない。
以上のようにしてパワー調整が施されたパワー補整用スペクトルPCSPがスペクトルSPと合成される。このスペクトルSPとパワー補整用スペクトルPCSPとの合成手法の一例について、図5のフローチャートを用いて説明する。先ずステップS20において、スペクトル本数のカウンタiの値を0にリセットする。
次にステップS21において、i番目のスペクトルSP[i]が閾値Th以下であるか否かが判別される。ステップS21においてスペクトルSP[i]が閾値Th以下である場合(Yes)にはステップS22に進み、スペクトルSP[i]が閾値Thよりも大きい場合(No)にはステップS23進む。
ステップS22では、スペクトルSP[i]をi番目のパワー補整用スペクトルPCSP[i]に置き換えてステップS23に進む。
ステップS23では、カウンタiの値を1つインクリメントして次のスペクトルに進む。
ステップS24では、カウンタiの値が符号化ユニット内のスペクトル本数に達したか否かが判別される。ステップS24においてカウンタiの値が符号化ユニット内のスペクトル本数に達している場合(Yes)には、合成処理を終了する。一方、カウンタiの値が符号化ユニット内のスペクトル本数に達していない場合(No)には、ステップS21に戻り、処理を続ける。
このように、閾値Th以下であるスペクトルSPをパワー補整用スペクトルPCSPと置き換えることにより、スペクトルSPとパワー補整用スペクトルPCSPとを合成する。
なお、スペクトルSPとパワー補整用スペクトルPCSPとの合成手法がこの例に限定されないことは勿論であり、閾値Thを0として、スペクトルSPが0である場合にのみパワー補整用スペクトルPCSPと置き換えるようにしても構わない。
また、閾値Thを設けず、全てのスペクトルSPに対してパワー補整用スペクトルPCSPを足し込むようにしても構わない。この場合の合成処理について、図6のフローチャートを用いて説明する。先ずステップS30において、スペクトル本数のカウンタiの値を0にリセットする。
次にステップS31において、スペクトルSP[i]にパワー補整用スペクトルPCSP[i]の値を足しこみ、続くステップS32においてカウンタiの値を1つインクリメントする。
続いてステップS33では、カウンタiの値が符号化ユニット内のスペクトル本数に達したか否かが判別される。ステップS33においてカウンタiの値が符号化ユニット内のスペクトル本数に達している場合(Yes)には、合成処理を終了する。一方、カウンタiの値が符号化ユニット内のスペクトル本数に達していない場合(No)には、ステップS31に戻り、処理を続ける。
以下、図7を用いて、パワー補整用スペクトルPCSPの生成及びパワー調整処理と、スペクトルSPとパワー補整用スペクトルPCSPとの合成処理の具体例を説明する。なお、この具体例では、パワー補整用スペクトルテーブルのエントリー数を1024とし、符号化ユニット内のスペクトル本数を8とする。また、図6に示した例のように、全てのスペクトルSPに対してパワー補整用スペクトルPCSPを足し込むものとして説明する。
先ず、パワー補整用スペクトルテーブルを参照するポイントを正規化係数インデックスの加算値から求める。この具体例では、正規化係数インデックスの和が1026となっているが、パワー補整用スペクトルテーブルのエントリー数が1024であるため、下位10ビットの値を用いる。すなわち、参照ポイントの値は2となる。したがって、パワー補整用スペクトルテーブルの3番目から10番目までの8個の値が選択され、これによりパワー補整用スペクトルPCSPの値は、{-0.223, 0.647, 0.115, 0.925, -0.254, 0.247, -0.872, -0.242} となる。
次に、正規化係数に基づいてパワー補整用スペクトルPCSPのパワーの調整が行われる。具体的には、パワー補整用スペクトルPCSPの値に正規化係数を乗算することによりパワーの調整を行う。ここで正規化係数は12000であるため、パワー補整用スペクトルの値は、{-2676, 7764, 1380, 11100, -3048, 2964, -10464, -2904}となる。
続いて、量子化精度情報の値に基づいてパワー補整用スペクトルPCSPのパワーの調整が行われる。具体的には、例えば量子化精度情報の値で除算することによりパワーの調整を行う。ここで、量子化精度情報の値は6であるため、パワー補整用スペクトルの値は、{-446, 1294, 230, 1850, -508, 494, -1744, -484}となる。
続いて、パワー調整情報の値に基づいてパワー補整用スペクトルPCSPのパワーの調整が行われる。具体的には、例えば((パワー調整情報値−9)×2)dB上げる操作を行うことによりパワーの調整を行う。なお、パワー調整情報値が0の場合は−∞dBとする。ここで、パワー調整情報の値は3であるため、−12dBの操作が行われ、パワー補整用スペクトルの値は、{-112, 324, 58, 463, -127, 124, -436, -121}となる。
続いて、ゲイン制御情報に基づいてパワー補整用スペクトルPCSPのパワーの調整が行われる。具体的には、例えば2の(ゲイン制御量情報)乗の値で除算することによりパワーの調整を行う。ここでゲイン制御情報の値は1であるため、2で除算する操作が行われ、パワー補整用スペクトルの値は、{-56, 162, 29, 232, -64, 62, -218, -61}となる。
以上のようにして生成されたパワー補整用スペクトルPCSPをスペクトルの値と加算合成することにより、最終的な合成スペクトルを得ることができる。ここで、スペクトルSPの値は、{12000, 0, -800, 0, 9600, 0, 0, -3200}であるため、生成したパワー補整用スペクトルPCSPと加算合成することにより、{11944, 162, -771, 232, 9536, 62, -218, -3261}という合成スペクトルが求められる。
実際のスペクトル例を図8に示す。ここで、図8(A)は、原音のスペクトルを示し、図8(B)は、従来法の符号化処理を施した後のスペクトルを示す。また、図8(C)は、本実施の形態の手法を用いてパワー補整用スペクトルPCSPと合成した後のスペクトルを示す。これらの図から分かるように、図8(B)のスペクトルでは図中矢印で示す部分等のスペクトルが抜けているが、図8(C)のスペクトルではこれらの部分にパワー補整用スペクトルPCSPが合成されることにより、パワー感の欠如が抑えられている。
以上説明したように、本実施の形態の説明に供する符号化方法及び装置、並びに本実施の形態における復号方法及び装置によれば、パワー補整用スペクトルPCSPをスペクトルSPと合成することにより、圧縮率を高めた場合であっても、時間的な帯域変動による異音やノイズ、或いはパワー感の欠如を低減することができ、結果として聴感上の品質を向上させることができる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
本実施の形態の基本概念を説明するフローチャートである。 本実施の形態の説明に供する符号化装置の概略構成を説明する図である。 本実施の形態における復号装置の概略構成を説明する図である。 同復号装置におけるパワー補整用スペクトルPCSPの生成及びパワー調整処理の一例を説明するフローチャートである。 スペクトルSPとパワー補整用スペクトルPCSPとの合成手法の一例を説明するフローチャートである。 スペクトルSPとパワー補整用スペクトルPCSPとの合成手法の他の例を説明するフローチャートである。 同パワー補整用スペクトルPCSPの生成及びパワー調整処理の具体例を説明する図である。 実際のスペクトル例を説明する図であり、同図(A)は、原音のスペクトルを示し、同図(B)は、従来法の符号化処理を施した後のスペクトルを示し、同図(C)は、本実施の形態の手法を用いてパワー補整用スペクトルPCSPと合成した後のスペクトルを示す。 従来の符号化装置の概略構成を説明する図である。 従来の復号装置の概略構成を説明する図である。
符号の説明
1 符号化装置、11 帯域分割部、12〜12 ゲイン制御部、13 ゲイン制御情報符号化部、14〜14 スペクトル変換部、15〜15 正規化部、16 正規化係数符号化部、17〜17 パワー調整情報決定部、18 パワー調整情報符号化部、19 量子化精度決定部、20〜20 量子化部、21 量子化精度情報符号化部、22 マルチプレクサ、30 復号装置、31 デマルチプレクサ、32 量子化精度情報復号部、33 正規化情報復号部、34〜34 信号成分構成部、35 ゲイン制御情報復号部、36 パワー調整情報復号部、37〜37 パワー補整用スペクトル生成合成部、38〜38 スペクトル逆変換部、39〜39 ゲイン制御部、40 帯域合成部

Claims (14)

  1. ディジタル信号をスペクトル変換して正規化及び量子化を行い、上記正規化に用いた正規化係数及び上記量子化に用いた量子化精度情報と共に符号化されたスペクトルを復号する復号方法において、
    上記量子化精度情報及び上記正規化係数を復号し、逆量子化及び逆正規化を行って上記スペクトルを復号するスペクトル復号工程と、
    パワー補整用スペクトルを生成するパワー補整用スペクトル生成工程と、
    生成された上記パワー補整用スペクトルのパワーを調整するパワー調整工程と、
    上記パワー調整工程にてパワー調整された上記パワー補整用スペクトルと、上記スペクトル復号工程にて復号された上記スペクトルとを合成する合成工程とを有し、
    上記パワー調整工程では、上記スペクトル復号工程にて復号された上記量子化精度情報に基づいて上記パワー補整用スペクトルのパワーを調整する
    ことを特徴とする復号方法。
  2. 上記パワー補整用スペクトル生成工程では、所定のスペクトルパターンから生成したテーブルの値を参照してパワー補整用スペクトルを生成することを特徴とする請求項1記載の復号方法。
  3. 上記パワー補整用スペクトル生成工程では、上記テーブルから値を参照する位置を上記スペクトルの符号化に用いたデータに基づいて決定することを特徴とする請求項2記載の復号方法。
  4. 上記スペクトルの符号化に用いたデータは、正規化係数であることを特徴とする請求項3記載の復号方法。
  5. 上記スペクトルの符号化に用いたデータは、量子化精度情報であることを特徴とする請求項3記載の復号方法。
  6. 上記パワー補整用スペクトル生成工程では、ランダムな数値列を用いて上記パワー補整用スペクトルを生成することを特徴とする請求項1記載の復号方法。
  7. 上記ランダムな数値列は、ガウシアン分布数値列であることを特徴とする請求項6記載の復号方法。
  8. 上記パワー調整工程では、さらに、上記スペクトルの復号に用いた正規化係数に基づいて上記パワー補整用スペクトルのパワーを調整することを特徴とする請求項1記載の復号方法。
  9. 上記パワー調整工程では、さらに、上記スペクトルの符号化時に符号化されたパワー調整情報に基づいて上記パワー補整用スペクトルのパワーを調整することを特徴とする請求項1記載の復号方法。
  10. 上記合成工程では、上記スペクトルと上記パワー補整用スペクトルとを加算することを特徴とする請求項1記載の復号方法。
  11. 上記合成工程では、上記スペクトルの少なくとも一部と上記パワー補整用スペクトルとを置き換えることを特徴とする請求項1記載の復号方法。
  12. 上記合成工程では、所定の値以下の上記スペクトルと上記パワー補整用スペクトルとを合成することを特徴とする請求項1記載の復号方法。
  13. ディジタル信号をスペクトル変換して正規化及び量子化を行い、上記正規化に用いた正規化係数及び上記量子化に用いた量子化精度情報と共に符号化されたスペクトルを復号する復号装置において、
    上記量子化精度情報及び上記正規化係数を復号し、逆量子化及び逆正規化を行って上記スペクトルを復号するスペクトル復号手段と、
    パワー補整用スペクトルを生成するパワー補整用スペクトル生成手段と、
    生成された上記パワー補整用スペクトルのパワーを調整するパワー調整手段と、
    上記パワー調整手段によってパワー調整された上記パワー補整用スペクトルと、上記スペクトル復号手段によって復号された上記スペクトルとを合成する合成手段とを備え、
    上記パワー調整手段は、上記スペクトル復号手段によって復号された上記量子化精度情報に基づいて上記パワー補整用スペクトルのパワーを調整する
    ことを特徴とする復号装置。
  14. ディジタル信号をスペクトル変換して正規化及び量子化を行い、上記正規化に用いた正規化係数及び上記量子化に用いた量子化精度情報と共に符号化されたスペクトルを復号する復号処理をコンピュータに実行させるプログラムにおいて、
    上記量子化精度情報及び上記正規化係数を復号し、逆量子化及び逆正規化を行って上記スペクトルを復号するスペクトル復号工程と、
    パワー補整用スペクトルを生成するパワー補整用スペクトル生成工程と、
    生成された上記パワー補整用スペクトルのパワーを調整するパワー調整工程と、
    上記パワー調整工程にてパワー調整された上記パワー補整用スペクトルと、上記スペクトル復号工程にて復号された上記スペクトルとを合成する合成工程とを有し、
    上記パワー調整工程では、上記スペクトル復号工程にて復号された上記量子化精度情報に基づいて上記パワー補整用スペクトルのパワーを調整する
    ことを特徴とするプログラム。
JP2005125583A 2005-04-22 2005-04-22 復号方法及び装置 Expired - Fee Related JP4297078B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005125583A JP4297078B2 (ja) 2005-04-22 2005-04-22 復号方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005125583A JP4297078B2 (ja) 2005-04-22 2005-04-22 復号方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002132188A Division JP4296752B2 (ja) 2002-05-07 2002-05-07 符号化方法及び装置、復号方法及び装置、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2005284301A true JP2005284301A (ja) 2005-10-13
JP4297078B2 JP4297078B2 (ja) 2009-07-15

Family

ID=35182666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005125583A Expired - Fee Related JP4297078B2 (ja) 2005-04-22 2005-04-22 復号方法及び装置

Country Status (1)

Country Link
JP (1) JP4297078B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007310192A (ja) * 2006-05-19 2007-11-29 Yamaha Corp 音声処理装置およびプログラム
JP2008090178A (ja) * 2006-10-04 2008-04-17 Sharp Corp 信号処理方法、信号処理装置及びプログラム
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03144600A (ja) * 1989-10-31 1991-06-19 Nec Corp 音声復号器
JPH03182800A (ja) * 1989-12-13 1991-08-08 Fujitsu Ltd 音声符号化方式
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JPH09135173A (ja) * 1995-11-10 1997-05-20 Sony Corp 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JPH09261064A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 符号器及び復号器
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
JP2000235398A (ja) * 1998-12-11 2000-08-29 Sony Corp 復号装置および方法、並びに記録媒体
JP2002050967A (ja) * 1993-05-31 2002-02-15 Sony Corp 信号記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03144600A (ja) * 1989-10-31 1991-06-19 Nec Corp 音声復号器
JPH03182800A (ja) * 1989-12-13 1991-08-08 Fujitsu Ltd 音声符号化方式
JP2002050967A (ja) * 1993-05-31 2002-02-15 Sony Corp 信号記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JPH09135173A (ja) * 1995-11-10 1997-05-20 Sony Corp 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JPH09261064A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 符号器及び復号器
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
JP2000235398A (ja) * 1998-12-11 2000-08-29 Sony Corp 復号装置および方法、並びに記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007310192A (ja) * 2006-05-19 2007-11-29 Yamaha Corp 音声処理装置およびプログラム
JP2008090178A (ja) * 2006-10-04 2008-04-17 Sharp Corp 信号処理方法、信号処理装置及びプログラム
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム

Also Published As

Publication number Publication date
JP4297078B2 (ja) 2009-07-15

Similar Documents

Publication Publication Date Title
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
EP2250641B1 (en) Apparatus for mixing a plurality of input data streams
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP3926726B2 (ja) 符号化装置および復号化装置
EP3217398B1 (en) Advanced quantizer
JP4296753B2 (ja) 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP4308229B2 (ja) 符号化装置および復号化装置
KR20160120713A (ko) 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP4297078B2 (ja) 復号方法及び装置
JP5098492B2 (ja) 信号処理装置及び信号処理方法、並びにプログラム
CA2821325C (en) Mixing of input data streams and generation of an output data stream therefrom
AU2012202581B2 (en) Mixing of input data streams and generation of an output data stream therefrom

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090324

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090406

R151 Written notification of patent or utility model registration

Ref document number: 4297078

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140424

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees