JP2011197106A - 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム - Google Patents

符号化装置および符号化方法、復号装置および復号方法、並びにプログラム Download PDF

Info

Publication number
JP2011197106A
JP2011197106A JP2010061171A JP2010061171A JP2011197106A JP 2011197106 A JP2011197106 A JP 2011197106A JP 2010061171 A JP2010061171 A JP 2010061171A JP 2010061171 A JP2010061171 A JP 2010061171A JP 2011197106 A JP2011197106 A JP 2011197106A
Authority
JP
Japan
Prior art keywords
envelope
unit
quantization
noise shaping
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010061171A
Other languages
English (en)
Other versions
JP5316896B2 (ja
Inventor
Shiro Suzuki
志朗 鈴木
Yuki Matsumura
祐樹 松村
Yasuhiro Tokuri
康裕 戸栗
Yuji Maeda
祐児 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2010061171A priority Critical patent/JP5316896B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN201180013285.7A priority patent/CN102792371B/zh
Priority to EP11756122.5A priority patent/EP2525356B1/en
Priority to EP16160573.8A priority patent/EP3070712B1/en
Priority to PCT/JP2011/055294 priority patent/WO2011114933A1/ja
Priority to RU2012138396/08A priority patent/RU2546324C2/ru
Priority to US13/583,994 priority patent/US8892429B2/en
Publication of JP2011197106A publication Critical patent/JP2011197106A/ja
Application granted granted Critical
Publication of JP5316896B2 publication Critical patent/JP5316896B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】音声信号の符号化による音質劣化を低減する。
【解決手段】正規化部12は、音声信号のスペクトルS0からエンベロープENVを抽出し、そのエンベロープENVを用いてスペクトルS0を正規化する。エンベロープ強調部51は、エンベロープENVを強調する。ノイズシェーピング部52は、強調されたエンベロープENVである強調エンベロープDを1より大きい値で除算し、その除算結果から情報NSで特定されるノイズシェーピングGを減算する。量子化部14は、その減算結果を量子化ビット数WLとして、その量子化ビット数WLに基づいて正規化されたスペクトルS0である正規化スペクトルS1を量子化する。多重化部53は、情報NS、量子化された正規化スペクトルS1である量子化スペクトルQS、およびエンベロープENVを多重化する。本発明は、例えば、音声信号を符号化する符号化装置に適用することができる。
【選択図】図5

Description

本発明は、符号化装置および符号化方法、復号装置および復号方法、並びにプログラムに関し、特に、音声信号の符号化による音質劣化を低減することができるようにした符号化装置および符号化方法、復号装置および復号方法、並びにプログラムに関する。
音声信号の符号化方法としては、一般的に、MP3(Moving Picture Experts Group Audio Layer-3),AAC(Advanced Audio Coding),ATRAC(Adaptive Transform Acoustic Coding)といった変換符号化方法がよく知られている。
図1は、音声信号を符号化する符号化装置の構成例を示すブロック図である。
図1の符号化装置10は、例えばMDCT(Modified Discrete Cosine Transform)部11、正規化部12、ビット配分部13、量子化部14、および多重化部15により構成される。
符号化装置10のMDCT部11には、音声のPCM(Pulse Code Modulation)信号が音声信号として入力される。MDCT部11は、時間領域信号である音声信号に対してMDCTを行い、周波数領域信号であるスペクトルS0を得る。MDCT部11は、スペクトルS0を正規化部12に供給する。
正規化部12は、スペクトルS0から、量子化ユニットと呼ばれる複数本のスペクトル単位でエンベロープENVを抽出し、ビット配分部13と多重化部15に供給する。また、正規化部12は、量子化ユニットごとに、エンベロープENVを用いてスペクトルS0を正規化し、その結果得られる正規化スペクトルS1を量子化部14に供給する。
ビット配分部13は、正規化部12からエンベロープENVが供給された場合、そのエンベロープENVに基づいて、予め設定されているビット配分アルゴリズムにしたがって、多重化部15により生成されるビットストリームBSのビット数が所望の範囲内になるように、正規化スペクトルS1の量子化情報WLを決定する。なお、量子化情報WLとは、量子化精度を表す情報であり、ここでは、量子化ビット数である。ビット配分部13は、量子化情報WLを量子化部14に供給する。
また、前回の量子化情報WLに基づいて正規化スペクトルS1が量子化された結果得られる量子化スペクトルQSのビット数Nが量子化部14からフィードバックされた場合には、ビット配分部13は、そのビット数Nに基づいて、ビットストリームBSのビット数が所望の範囲内になるかどうかを判定する。ビット配分部13は、ビットストリームBSのビット数が所望の範囲内にならないと判定された場合、ビットストリームBSのビット数が所望の範囲内になるように、量子化情報WLを新たに決定する。そして、ビット配分部13は、新たな量子化情報WLを量子化部14に供給する。
一方、ビットストリームBSのビット数が所望の範囲内になると判定された場合、ビット配分部13は、量子化部14に出力を指示するとともに、現在の量子化情報WLを多重化部15に供給する。
量子化部14は、ビット配分部13から供給される量子化情報WLに基づいて、正規化部12から供給される量子化ユニット単位の正規化スペクトルS1を量子化する。量子化部14は、その結果得られる量子化スペクトルQSのビット数Nをビット配分部13に供給する。量子化部14は、ビット配分部13から出力が指示された場合、現在の量子化情報WLに基づいて量子化された量子化スペクトルQSを多重化部15に供給する。
多重化部15は、正規化部12から供給されるエンベロープENV、ビット配分部13から供給される量子化情報WL、および量子化部14から供給される量子化スペクトルQSを多重化してビットストリームBSを生成する。多重化部15は、そのビットストリームBSを符号化結果として出力する。
以上のように、符号化装置10は、エンベロープENVと量子化スペクトルQSだけでなく、量子化情報WLも含まれたビットストリームBSを生成する。これにより、ビットストリームBSの復号時に、量子化スペクトルQSから正規化スペクトルS1を復元することができる。
図2は、図1の多重化部15により生成されるビットストリームBSの構成例を示す図である。
図2に示すように、ビットストリームBSは、スペクトルの上限値などを含むヘッダHeader、エンベロープENV、量子化情報WL、および量子化スペクトルQSにより構成される。
ところで、図3に示すように、エンベロープENVも量子化情報WLも、量子化ユニットごとの値である。従って、量子化スペクトルQSだけでなく、エンベロープENVと量子化情報WLも、量子化ユニット数分必要となる。よって、量子化ユニット数をUとすると、量子化情報WLを伝送するために必要なビット数NWLは、量子化情報WLのビット数と量子化ユニット数Uの乗算値となる。その結果、量子化ユニット数Uが多いと、ビット数NWLも増大する。なお、図3において、[k]のkは、量子化ユニットのインデックスを表しており、iは任意の値を表している。ここでは、インデックスは、低域の量子化ユニットから順に、1から付与されるものとする。
また、エンベロープENVは、予め量子化ユニット単位のビット数が決まっている場合が多い。従って、ビット配分部13は、量子化情報WLを変更して、量子化スペクトルQSのビット数Nを変化させることにより、ビットストリームBSのビット数を所定値に制御する。
図4は、図1の符号化装置10による符号化結果を復号する復号装置の構成例を示すブロック図である。
図4の復号装置20は、分解化部21、逆量子化部22、逆正規化部23、および逆MDCT部24により構成される。
復号装置20の分解化部21には、符号化装置10による符号化結果であるビットストリームBSが入力される。分解化部21は、ビットストリームBSから、エンベロープENVと量子化情報WLを分解する。また、分解化部21は、量子化情報WLに基づいて、ビットストリームBSから量子化スペクトルQSを分解する。分解化部21は、エンベロープENVを逆正規化部23に供給し、量子化情報WLと量子化スペクトルQSを逆量子化部22に供給する。
逆量子化部22は、分解化部21から供給される量子化情報WLに基づいて量子化スペクトルQSを逆量子化し、その結果得られる正規化スペクトルS1を逆正規化部23に供給する。
逆正規化部23は、逆量子化部22から供給される正規化スペクトルS1を、分解化部21から供給されるエンベロープENVを用いて逆正規化し、その結果得られるスペクトルS0を逆MDCT部24に供給する。
逆MDCT部24は、逆正規化部23から供給される周波数領域信号であるスペクトルS0に対して逆MDCTを行い、時間領域信号である音声のPCM信号を得る。逆MDCT部24は、音声のPCM信号を音声信号として出力する。
以上のように、符号化装置10は、量子化情報WLをビットストリームBSに含めるので、符号化装置10で量子化情報WLを任意に変化させた場合であっても、符号化対象の音声信号と復号結果の音声信号を一致させることができる。従って、符号化装置10は、量子化情報WLを用いてビットストリームBSのビット数を制御することができる。また、符号化装置10のみを改良し、量子化情報WLに最適値を設定することで、音質を向上させることができる。
しかしながら、量子化情報WLを伝送するために多くのビット数が必要になると、量子化スペクトルQSのビット数が相対的に減少し、音質劣化を招いてしまう。
そこで、量子化情報WLを、符号化装置および復号装置において一意に決定される固定値と、その量子化情報WLから固定値を減算した差分値に分割し、その差分値を低いビット数で符号化する方法が考案されている(例えば、特許文献1参照)。
特許第3186290号公報
しかしながら、差分値は量子化ユニット数分必要であるため、量子化情報WLを伝送するために必要なビット数は、充分に小さくならない。その結果、音質劣化を低減することは困難である。このことは、特に高効率符号化の実現、つまり低ビットレート化の際に大きな障害となる。
本発明は、このような状況に鑑みてなされたものであり、音声信号の符号化による音質劣化を低減することができるようにするものである。
本発明の第1の側面の符号化装置は、音声信号のスペクトルからエンベロープを抽出し、そのエンベロープを用いて前記スペクトルを正規化する正規化手段と、前記エンベロープを強調するエンベロープ強調手段と、前記エンベロープ強調手段により強調された前記エンベロープを1より大きい値で除算し、その除算結果から所定の情報により特定されるノイズシェーピングを減算するノイズシェーピング手段と、前記ノイズシェーピング手段による減算結果を量子化ビット数として、その量子化ビット数に基づいて前記正規化手段により正規化された前記スペクトルを量子化する量子化手段と、前記所定の情報、前記量子化手段により量子化された前記スペクトル、および前記エンベロープを多重化する多重化手段とを備える符号化装置である。
本発明の第1の側面の符号化方法およびプログラムは、本発明の第1の側面の符号化装置に対応する。
本発明の第1の側面においては、音声信号のスペクトルからエンベロープが抽出され、そのエンベロープを用いて前記スペクトルが正規化され、前記エンベロープが強調され、強調された前記エンベロープが1より大きい値で除算され、その除算結果から所定の情報により特定されるノイズシェーピングが減算され、その減算結果が量子化ビット数とされて、その量子化ビット数に基づいて正規化された前記スペクトルが量子化され、前記所定の情報、量子化された前記スペクトル、および前記エンベロープが多重化される。
本発明の第2の側面の復号装置は、多重化されている所定の情報、量子化された音声信号のスペクトル、および前記スペクトルのエンベロープから、前記所定の情報と前記エンベロープを分解する情報分解化手段と、前記エンベロープを強調するエンベロープ強調手段と、前記エンベロープ強調手段により強調された前記エンベロープを1より大きい値で除算し、その除算結果から前記所定の情報により特定されるノイズシェーピングを減算するノイズシェーピング手段と、前記ノイズシェーピング手段による減算結果を量子化ビット数として用いて、多重化されている前記所定の情報、量子化された前記スペクトル、および前記エンベロープから、量子化された前記スペクトルを分解するスペクトル分解化手段と、前記量子化ビット数に基づいて、量子化された前記スペクトルを逆量子化する逆量子化手段と、前記エンベロープを用いて、前記逆量子化手段により逆量子化された前記スペクトルを逆正規化する逆正規化手段とを備える復号装置である。
本発明の第2の側面の復号方法およびプログラムは、本発明の第2の側面の復号装置に対応する。
本発明の第2の側面においては、多重化されている所定の情報、量子化された音声信号のスペクトル、および前記スペクトルのエンベロープから、前記所定の情報と前記エンベロープが分解され、前記エンベロープが強調され、強調された前記エンベロープが1より大きい値で除算され、除算結果から前記所定の情報により特定されるノイズシェーピングが減算され、その減算結果が量子化ビット数として用いられて、多重化されている前記所定の情報、量子化された前記スペクトル、および前記エンベロープから、量子化された前記スペクトルが分解され、前記量子化ビット数に基づいて、量子化された前記スペクトルが逆量子化され、前記エンベロープを用いて、逆量子化された前記スペクトルが逆正規化される。
第1の側面の符号化装置および第2の側面の復号装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
本発明の第1の側面によれば、音声信号の符号化による音質劣化を低減することができる。
また、本発明の第2の側面によれば、符号化による音質劣化を低減するように符号化された音声信号を復号することができる。
音声信号を符号化する符号化装置の構成例を示すブロック図である。 図1の多重化部により生成されるビットストリームの構成例を示す図である。 エンベロープと量子化情報を説明する図である。 図1の符号化装置による符号化結果を復号する復号装置の構成例を示すブロック図である。 本発明を適用した表示装置の第1実施の形態の構成例を示すブロック図である。 図5の多重化部により生成されるビットストリームの構成例を示す図である。 図5のエンベロープ強調部の詳細構成例を示すブロック図である。 図7のエンベロープ強調部の処理を説明する図である。 図5のノイズシェーピング部の詳細構成例を示すブロック図である。 図9のノイズシェーピング部によるノイズシェーピングの生成方法を説明する図である。 ノイズシェーピング部による量子化情報の生成方法を説明する図である。 ノイズシェーピング部によるビットストリームのビット数の調整を説明する図である。 エンベロープを強調することによる効果を説明する図である。 エンベロープを強調することによる効果を説明する図である。 図5の符号化装置による符号化処理を説明するフローチャートである。 図15のステップS14の強調エンベロープ生成処理の詳細を説明するフローチャートである。 図15のステップS15のノイズシェーピング処理の詳細を説明するフローチャートである。 図5の符号化装置により符号化されたビットストリームを復号する復号装置の構成例を示すブロック図である。 図18のノイズシェーピング部の詳細構成例を示すブロック図である。 図18の復号装置による復号処理を説明するフローチャートである。 図20のステップS103のノイズシェーピング処理を説明するフローチャートである。 本発明を適用した表示装置の第2実施の形態の構成例を示すブロック図である。 図22の多重化部により生成されるビットストリームの構成例を示す図である。 図22のノイズシェーピング部の詳細構成例を示すブロック図である。 量子化情報の演算を複数種類用意することによる効果を説明する図である。 エンベロープを強調することによる効果を説明する図である。 図22の符号化装置によるノイズシェーピング処理を説明するフローチャートである。 図22の符号化装置により符号化されたビットストリームを復号する復号装置の構成例を示すブロック図である。 図28のノイズシェーピング部の詳細構成例を示すブロック図である。 図28の復号装置によるノイズシェーピング処理を説明するフローチャートである。 コンピュータの一実施の形態の構成例を示す図である。
<第1実施の形態>
[符号化装置の第1実施の形態の構成例]
図5は、本発明を適用した表示装置の第1実施の形態の構成例を示すブロック図である。
図5に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図5の符号化装置50の構成は、主に、ビット配分部13の代わりにエンベロープ強調部51とノイズシェーピング部52が設けられている点、および、多重化部15の代わりに多重化部53が設けられている点が図1の構成と異なる。
エンベロープ強調部51は、正規化部12により抽出された量子化ユニット単位のエンベロープENV[k]を強調する。具体的には、エンベロープ強調部51は、正規化部12により抽出された量子化ユニット単位のエンベロープENV[k]を用いて、エンベロープENV[k]の値の増減が強調された量子化ユニット単位の強調エンベロープD[k]を生成する。そして、エンベロープ強調部51は、その強調エンベロープD[k]をノイズシェーピング部52に供給する。エンベロープ強調部51の詳細については、後述する図7を参照して説明する。
ノイズシェーピング部52は、例えばエンベロープ強調部51から供給される量子化ユニット単位の強調エンベロープD[k]を2で除算した値D[k]/2から、情報NSにより特定される量子化ユニット単位のノイズシェーピングG[k]を減算する。なお、情報NSとは、全量子化ユニットのノイズシェーピングGの最低値Lと最高値Hである。ノイズシェーピング部52は、その結果得られる値を量子化情報WL[k]として量子化部14に供給する。
また、ノイズシェーピング部52は、エンベロープ強調部51から供給される強調エンベロープD[k]が供給された場合、その強調エンベロープD[k]に基づいて、多重化部53により生成されるビットストリームBS´のビット数が所望の範囲内になるように、情報NSを決定する。さらに、ノイズシェーピング部52は、前回の量子化情報WLに基づいて正規化スペクトルS1が量子化された結果得られる量子化スペクトルQS[k]のビット数Nが量子化部14からフィードバックされた場合、そのビット数Nに基づいて、ビットストリームBS´のビット数が所望の範囲内になるかどうかを判定する。ノイズシェーピング部52は、ビットストリームBS´のビット数が所望の範囲内にならないと判定された場合、ビットストリームBS´のビット数が所望の範囲内になるように、情報NSを新たに決定する。これにより、新たな量子化情報WLが量子化部14に供給される。
一方、ビットストリームBS´のビット数が所望の範囲内になると判定された場合、ノイズシェーピング部52は、量子化部14に出力を指示するとともに、現在の情報NSを多重化部53に供給する。なお、ノイズシェーピング部52の詳細については、後述する図9を参照して説明する。
多重化部53は、正規化部12から供給されるエンベロープENV[k]、ノイズシェーピング部52から供給される情報NS、および量子化部14から供給される量子化スペクトルQS[k]を多重化してビットストリームBS´を生成する。多重化部53は、そのビットストリームBS´を符号化結果として出力する。
以上のように、符号化装置50は、量子化情報WLを直接制御するのではなく、量子化情報WLの生成に用いられるノイズシェーピングGを特定する情報NSを制御することにより、ビットストリームBS´のビット数を調整する。そして、符号化装置50は、量子化情報WLの代わりに情報NSをビットストリームBS´に含める。
[ビットストリームの構成例]
図6は、図5の多重化部53により生成されるビットストリームBS´の構成例を示す図である。
図6に示すように、ビットストリームBS´は、スペクトルの上限値などを含むヘッダHeader、エンベロープENV[k]、情報NS、および量子化スペクトルQS[k]により構成される。
このように、ビットストリームBS´では、量子化情報WLの代わりに、ノイズシェーピングGの最低値Lと最高値Hからなる情報NSが含まれるので、量子化情報WLの伝送のために必要なビット数は、最低値Lのビット数NLと最高値Hのビット数NHの加算値NNSとなる。従って、量子化ユニット数Uが十分大きい場合、量子化情報WLのビット数と量子化ユニット数Uの乗算値に比べて加算値NNSは十分小さくなる。即ち、符号化装置50において量子化情報WLの伝送のために必要なビット数は、量子化情報WLがビットストリームBSに含まれる従来の場合に比べて十分小さくなる。
その結果、ビットストリームBS´では、従来の場合に比べて、相対的に量子化スペクトルQS[k]のビット数が多くなり、符号化による音質劣化を低減することができる。
[エンベロープ強調部の詳細構成例]
図7は、図5のエンベロープ強調部51の詳細構成例を示すブロック図である。
図7に示すように、例えばエンベロープ強調部51は、順方向強調部61および逆方向強調部62により構成される。
順方向強調部61は、差分計算部71、加算部72、および加算量テーブル部73により構成される。
順方向強調部61の差分計算部71は、図5の正規化部12から供給されるインデックスk+1の量子化ユニットのエンベロープENV[k+1]から、インデックスkの量子化ユニットのエンベロープENV[k]を減算し、差分diff[k+1]を求める。差分計算部71は、求められた差分diff[k+1]とエンベロープENV[k+1]を加算部72に供給する。
加算部72は、差分計算部71から供給される差分diff[k+1]が正の値である場合、その差分diff[k+1]に対応する加算量を加算量テーブル部73から読み出し、その加算量をエンベロープENV[k+1]に加算する。加算部72は、その結果得られる値を順方向強調エンベロープDo[k+1]として逆方向強調部62に供給する。
加算量テーブル部73は、差分diffと加算量を対応付けたテーブルである加算量テーブルを記憶する。加算量テーブルには、例えば、差分diff「1」に対応して加算量「1」が登録され、差分diff「2」に対応して加算量「2」が登録されている。また、差分diff「3」に対応して加算量「3」が登録され、差分diff「4」に対応して加算量「4」が登録され、差分diff「5以上」に対応して、加算量「5」が登録される。なお、加算量テーブルの構成は、勿論、これに限定されない。
逆方向強調部62は、差分計算部81、加算部82、および加算量テーブル部83により構成される。
逆方向強調部62の差分計算部81は、正規化部12から供給されるエンベロープENV[k]からエンベロープENV[k+1]を減算し、差分diff[k]を求める。差分計算部81は、求められた差分diff[k]を加算部82に供給する。
加算部82は、差分計算部81から供給される差分diff[k]が正の値である場合、その差分diff[k]に応じた加算量を加算量テーブル部83から読み出す。加算部82は、その加算量を、加算部72から供給される順方向強調エンベロープDo[k]に加算する。加算部82は、その結果得られる値を強調エンベロープD[k]としてノイズシェーピング部52(図5)に供給する。
加算量テーブル部83は、差分diffと加算量を対応付けたテーブルである加算量テーブルを記憶する。ここでは、加算量テーブル部73により記憶される加算量テーブルと加算量テーブル部83により記憶される加算テーブルは同一であるものとするが、異なっていてもよい。
[エンベロープ強調部の処理の説明]
図8は、図7のエンベロープ強調部51の処理を説明する図である。
図8では、図8Aに示すように、正規化部12から供給されるエンベロープENV[i]乃至ENV[i+4]が、順に、1,5,10,5,1である場合のエンベロープ強調部51の処理を説明する。
この場合、順方向強調部61の差分計算部71(図7)により求められる差分diff[i+1]乃至diff[i+4]は、順に、4、5、-5、-4となる。なお、差分diff[i]に関しては、iより小さいインデックスがないので、ここでは、差分diff[i]は0とする。従って、図8Bに示すように、順方向強調エンベロープDo[i]は1のままとなり、順方向強調エンベロープDo[i+1]は、エンベロープENV[i+1]と、差分diff[i+1]である「4」に対応する加算量「4」の加算値9となる。また、順方向強調エンベロープDo[i+2]は、エンベロープENV[i+2]と、差分diff[i+2]である「5」に対応する加算量「5」の加算値15となり、順方向強調エンベロープDo[i+3]は5のままとなる。また、順方向強調エンベロープDo[i+4]は1のままとなる。
また、逆方向強調部62の差分計算部82により求められる差分diff[i]乃至diff[i+3]は、順に、-4、-5、5、4となる。なお、差分diff[i+4]に関しては、i+4より大きいインデックスがないので、ここでは、差分diff[i+4]は0とする。従って、図8Cに示すように、強調エンベロープD[i]は1のままとなり、強調エンベロープD[i+1]は、順方向強調エンベロープDo[i+1]である9のままとなる。また、強調エンベロープD[i+2]は、順方向強調エンベロープDo[i+2]と、差分diff[i+2]である「5」に対応する加算量「5」の加算値20となり、強調エンベロープD[i+3]は、順方向強調エンベロープDo[i+3]と、差分diff[i+3]である「4」に対応する加算量「4」の加算値9となる。また、強調エンベロープD[i+4]は1のままとなる。
以上のようにして、エンベロープ強調部51は、図8Aに示したエンベロープENVから、そのエンベロープENVの突出部分がより強調された図8Cの強調エンベロープDを生成する。
[ノイズシェーピング部の詳細構成例]
図9は、図5のノイズシェーピング部52の詳細構成例を示すブロック図である。
図9に示すように、ノイズシェーピング部52は、NS決定部91、ノイズシェーピング生成部92、除算部93、および減算部94により構成される。
ノイズシェーピング部52のNS決定部91は、図5のエンベロープ強調部51から各量子化ユニットの強調エンベロープD[k]が供給された場合、その強調エンベロープD[k]に基づいて、ビットストリームBS´のビット数が所望の範囲内になるように、情報NSを決定する。
また、NS決定部91は、前回の情報NSで特定される量子化情報WLに基づいて量子化された量子化スペクトルQS[k]のビット数Nが、図5の量子化部14からフィードバックされた場合、そのビット数Nに基づいて、ビットストリームBS´のビット数が所望の範囲内になるかどうかを判定する。NS決定部91は、ビットストリームBS´のビット数が所望の範囲内にならないと判定された場合、ビットストリームBS´のビット数が所望の範囲内になるように、情報NSを新たに決定する。
例えば、ビットストリームBS´のビット数が所望の範囲より小さい場合、NS決定部91は、情報NSの最高値Hを小さくする。一方、ビットストリームBS´のビット数が所望の範囲より大きい場合、NS決定部91は、まず、最高値Hを大きくする。そして、最高値Hが大きくなってもビットストリームBS´のビット数が所望の範囲より大きい場合、NS決定部91は、最低値Lを大きくする。NS決定部91は、決定されたNSをノイズシェーピング生成部92に供給する。
一方、ビットストリームBS´のビット数が所望の範囲内になると判定された場合、NS決定部91は、現在の情報NSを多重化部53(図5)に供給するとともに、量子化部14に出力を指示する。
ノイズシェーピング生成部92は、NS決定部91から供給される情報NSに基づいて、各量子化ユニットのノイズシェーピングG[k]を生成する。具体的には、例えば、ノイズシェーピング生成部92は、情報NSに含まれる最低値Lを、最低域、即ち最初の量子化ユニットのノイズシェーピングとし、最高値Hを、最高域、即ち最後の量子化ユニットのノイズシェーピングとする。そして、ノイズシェーピング生成部92は、最初の量子化ユニットのノイズシェーピングと最後の量子化ユニットのノイズシェーピングを結んだ直線を量子化し、各量子化ユニットのノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部92は、生成されたノイズシェーピングG[k]を減算部94に供給する。
除算部93は、図5のエンベロープ強調部51から供給される各量子化ユニットの強調エンベロープD[k]を2で除算する。除算部93は、その結果得られる除算値D[k]/2を減算部94に供給する。
減算部94は、除算部93から供給される除算値D[k]/2から、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]を減算し、その結果得られる減算値を量子化情報WL[k]として量子化部14(図5)に供給する。
以上のように、ノイズシェーピング部52は、強調エンベロープD[k]を1より大きい値で除算することにより、量子化情報WLの配分をなめらかにすることができる。その結果、特定のスペクトルのみにビットが配分され、隣接するスペクトルに充分にビットが配分されない場合に比べて、復号結果の品質が向上する。
[ノイズシェーピング部の処理の説明]
図10は、図9のノイズシェーピング部52によるノイズシェーピングGの生成方法を説明する図である。
図10の例では、最低値Lが1であり、最高値Hが5である。また、量子化ユニット数は5となっている。
図10Aに示すように、ノイズシェーピング生成部92は、まず、最低値Lを最初の量子化ユニット1のノイズシェーピングG[1]とし、最高値Hを最後の量子化ユニット5のノイズシェーピングG[5]とする。そして、ノイズシェーピング生成部92は、最初の量子化ユニット1のノイズシェーピングG[1]と最後の量子化ユニット5のノイズシェーピングG[5]を結んだ直線を得る。その後、ノイズシェーピング生成部92は、図10Bに示すように、この直線を量子化し、量子化ユニットごとのノイズシェーピングG[k]を得る。図10Bの例では、ノイズシェーピングG[1]乃至G(5)は、順に、1,2,3,4,5となる。
なお、ノイズシェーピングGの直線の量子化は、例えば、予め決められた数式を用いて行われる。また、ノイズシェーピングGの直線の量子化は、量子化結果と情報NSを対応付けたテーブルを予め記憶しておき、情報NSに対応する量子化結果を読み出すことにより行われるようにしてもよい。
図10に示すように、後方のインデックスの量子化ユニットほど、即ち高域ほど大きくなるようにノイズシェーピングG[k]が生成される場合、高域ほどS/Nを低下させることができる。これにより、高域ほど雑音が聞こえにくいという人間の聴覚特性に対応するノイズシェーピングを実現することができる。
従って、符号化装置50は、図10に示すように高域ほど大きくなるようにノイズシェーピングG[k]を生成することにより、ユーザが知覚する音質を損ねることなく、量子化スペクトルQS[k]の情報量を削減し、高効率な符号化を実現することができる。
図11は、ノイズシェーピング部52による量子化情報WLの生成方法を説明する図である。
図8Cに示した強調エンベロープD[i]乃至D[i+4]が強調エンベロープD[1]乃至D[5]としてノイズシェーピング部52に供給された場合、図11Aに示すように、除算値D[1]/2乃至D[5]/2は、順に、1,4,10,4,1となる。なお、本実施の形態では、小数点以下の値は切り捨てられるものとする。
そして、図10に示したノイズシェーピングG[1]乃至G[5]がノイズシェーピング生成部92により生成される場合、図11Bに示すように、量子化情報WL[1]乃至WL[5]は、順に、1,2,7,1,1となる。なお、本実施の形態では、量子化情報WL[k]が1より小さくなる場合には量子化情報WL[k]は1にされるものとする。
図12は、ノイズシェーピング部52によるビットストリームBS´のビット数の調整を説明する図である。
図12に示すように、最高値Hの値を変更することにより、ビットストリームBS´のビット数を調整することができる。
具体的には、例えば、最低値Lが1であり、最高値Hが5である場合、量子化前のノイズシェーピングGの直線は、直線101となる。一方、最低値Lが1であり、最高値Hが6である場合、量子化前のノイズシェーピングGの直線は、直線101より傾きが大きい直線102となる。従って、ノイズシェーピングG[k]が大きくなり、量子化情報WL[k]が小さくなる。よって、ビットストリームBS´のビット数を小さくすることができる。
また、最低値Lが1であり、最高値Hが4である場合、量子化前のノイズシェーピングGの直線は、直線101より傾きが小さい直線103となる。従って、ノイズシェーピングG[k]が小さくなり、量子化情報WL[k]が大きくなる。よって、ビットストリームBS´のビット数を大きくすることができる。
[エンベロープを強調することによる効果]
図13および図14は、エンベロープENVを強調することによる効果を説明する図である。
図13では、図13Aに示すように、エンベロープENV[1]乃至ENV[5]が、順に、16,13,10,7,2である場合について説明する。この場合、エンベロープENV[1]乃至ENV[5]が強調されずに、そのまま量子化情報WL[1]乃至WL[5]の生成に用いられると、例えばノイズシェーピングG[1]乃至G[5]の値が図10Bに示したような値である場合、量子化情報WL[1]乃至WL[5]は、図13Bに示すように、15,11,7,3,1となる。
以上のように、エンベロープENV[k]がそのまま量子化情報WL[k]の生成に用いられると、エンベロープENV[k]の波形の特性が量子化情報WL[k]の波形にも影響し、隣接する量子化ユニットの量子化情報WL[k]間の差分は、エンベロープENV[k]における差分と同等になる。なお、ノイズシェーピングG[k]の波形によっては、隣接する量子化ユニットの量子化情報WL[k]間の差分は、エンベロープENV[k]における差分より大きくなることもある。
これに対して、図13Aに示したエンベロープENV[1]乃至ENV[5]がエンベロープ強調部51により強調されると、図14Aに示すように、強調エンベロープD[1]乃至D[5]は、順に、19,16,13,12,2となる。従って、図14Bに示すように、除算値D[1]/2乃至D[5]/2は、順に、9,8,6,6,1となり、ノイズシェーピングG[1]乃至G[5]の値が図10Bに示したような値である場合、図14Cに示すように、量子化情報WL[1]乃至WL[5]は、順に、8,6,3,2,1となる。
以上のように、エンベロープENV[k]が強調されてから2で除算されたものが量子化情報WL[k]の生成に用いられると、隣接する量子化ユニットの量子化情報WL[k]間の差分は、比較的小さくなる。即ち、各量子化ユニットの量子化情報WL[k]は均一化される。その結果、特定のスペクトルのみにビットが配分され、隣接するスペクトルに充分にビットが配分されない場合に比べて、復号結果の品質が向上する。
[符号化装置の処理の説明]
図15は、図5の符号化装置50による符号化処理を説明するフローチャートである。この符号化処理は、例えば、音声信号が符号化装置50に入力されたとき、開始される。
図15のステップS11において、符号化装置50のMDCT部11は、入力された時間領域信号である音声信号に対してMDCTを行い、周波数領域信号であるスペクトルS0を得る。MDCT部11は、スペクトルS0を正規化部12に供給する。
ステップS12において、正規化部12は、スペクトルS0から、量子化ユニット単位でエンベロープENV[k]を抽出し、エンベロープ強調部51と多重化部53に供給する。
ステップS13において、正規化部12は、量子化ユニットごとに、エンベロープENV[k]を用いてスペクトルS0[k]を正規化し、その結果得られる正規化スペクトルS1[k]を量子化部14に供給する。
ステップS14において、エンベロープ強調部51は、エンベロープENV[k]を用いて強調エンベロープD[k]を生成する強調エンベロープ生成処理を行う。この強調エンベロープ生成処理の詳細は、後述する図16のフローチャートを参照して説明する。
ステップS15において、ノイズシェーピング部52は、ステップS14の強調エンベロープ生成処理により生成された強調エンベロープD[k]を2で除算した値からノイズシェーピングG[k]を減算するノイズシェーピング処理を行う。このノイズシェーピング処理の詳細は、後述する図17のフローチャートを参照して説明する。
ステップS16において、多重化部53は、正規化部12から供給されるエンベロープENV[k]、ノイズシェーピング部52から供給される情報NS、および量子化部14から供給される量子化スペクトルQS[k]を多重化してビットストリームBS´を生成する。多重化部15は、そのビットストリームBS´を符号化結果として出力する。そして処理は終了する。
図16は、図15のステップS14の強調エンベロープ生成処理の詳細を説明するフローチャートである。
図16のステップS20において、エンベロープ強調部51の順方向強調部61の差分計算部71(図7)は、正規化部12から供給される量子化ユニットのエンベロープENV[1]を、そのまま順方向強調エンベロープDo[1]として逆方向強調部62に供給する。
ステップS21において、順方向強調部61は、処理対象とするエンベロープENVのインデックスkを2に設定する。
ステップS22において、順方向強調部61の差分計算部71は、正規化部12から供給されるエンベロープENV[k+1]からエンベロープENV[k]を減算し、差分diff[k+1]を求める。差分計算部71は、求められた差分diff[k+1]とエンベロープENV[k+1]を加算部72に供給する。
ステップS23において、加算部72は、差分計算部71から供給される差分diff[k+1]が0より大きいかどうか、即ち差分diff[k+1]が正の値であるかどうかを判定する。ステップS23で差分diff[k+1]が0より大きいと判定された場合、ステップS24において、加算部72は、その差分diff[k+1]に対応する加算量を加算量テーブル部73から読み出す。
ステップS25において、加算部72は、エンベロープENV[k+1]とステップS24で読み出された加算量を加算し、その結果得られる値を順方向強調エンベロープDo[k+1]として逆方向強調部62に供給する。そして、処理はステップS26に進む。
一方、ステップS23で差分diff[k+1]が 0より大きくはないと判定された場合、加算部72は、エンベロープENV[k+1]をそのまま順方向強調エンベロープDo[k+1]として逆方向強調部62に供給する。そして、処理はステップS26に進む。
ステップS26において、順方向強調部61は、処理対象とするエンベロープENVのインデックスkが最後のインデックスEであるかどうか、即ち全ての量子化ユニットの順方向強調エンベロープDo[k]が逆方向強調部62に供給されたかどうかを判定する。
ステップS26で処理対象とするエンベロープENVのインデックスkが最後のインデックスEではないと判定された場合、ステップS27において、順方向強調部61は、インデックスkを1だけインクリメントし、処理をステップS22に戻す。これにより、処理対象とするエンベロープENVのインデックスkが最後のインデックスEとなるまで、ステップS22乃至S27の処理が繰り返される。
一方、ステップS26で処理対象とするエンベロープENVのインデックスkが最後のインデックスEであると判定された場合、ステップS28において、逆方向強調部62は、処理対象とするエンベロープENVのインデックスkを1に設定する。
ステップS29において、逆方向強調部62の差分計算部81は、正規化部12から供給されるエンベロープENV[k]からエンベロープENV[k+1]を減算し、差分diff[k]を求める。差分計算部81は、求められた差分diff[k]を加算部82に供給する。
ステップS30において、加算部82は、差分計算部81から供給される差分diff[k]が0より大きいかどうかを判定する。ステップS30で差分diff[k]が0より大きいと判定された場合、ステップS31において、その差分diff[k]に対応する加算量を加算量テーブル部83から読み出す。
ステップS32において、加算部82は、加算部72から供給される順方向強調エンベロープDo[k]とステップS30で読み出された加算量を加算する。加算部82は、その結果得られる値を強調エンベロープD[k]としてノイズシェーピング部52(図5)に供給する。そして処理はステップS33に進む。
一方、ステップS30で差分diff[k]が0より大きくはないと判定された場合、加算部82は、加算部72から供給される順方向強調エンベロープDo[k]をそのまま強調エンベロープD[k]としてノイズシェーピング部52に供給する。そして処理はステップS33に進む。
ステップS33において、逆方向強調部62は、処理対象とするエンベロープENVのインデックスkが最後の1つ前のインデックスであるかどうかを判定する。ステップS33で処理対象とするエンベロープENVのインデックスkが最後の1つ前のインデックスではないと判定された場合、ステップS34において、逆方向強調部62は、処理対象とするエンベロープENVのインデックスkを1だけインクリメントし、処理をステップS29に戻す。これにより、処理対象とするエンベロープENVのインデックスkが最後の1つ前のインデックスになるまで、ステップS29乃至S34の処理が繰り返される。
一方、ステップS33で処理対象とするエンベロープENVのインデックスkが最後のインデックスEの1つ前のインデックスであると判定された場合、処理はステップS35に進む。
ステップS35において、加算部82は、最後のインデックスEの順方向強調エンベロープDo[E]を強調エンベロープD[E]としてノイズシェーピング部52に供給する。そして、処理は図15のステップS14に戻り、処理はステップS15に進む。
図17は、図15のステップS15のノイズシェーピング処理の詳細を説明するフローチャートである。
図17のステップS41において、ノイズシェーピング部52のNS決定部91(図9)は、図5のエンベロープ強調部51から供給される強調エンベロープD[k]に基づいて、ビットストリームBS´のビット数が所望の範囲内になるように、情報NSを決定する。NS決定部91は、その情報NSをノイズシェーピング生成部92に供給する。
ステップS42において、ノイズシェーピング生成部92は、NS決定部91から供給される情報NSに基づいて、ノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部92は、生成されたノイズシェーピングG[k]を減算部94に供給する。
ステップS43において、除算部93は、図5のエンベロープ強調部51から供給される強調エンベロープD[k]を2で除算し、その結果得られる除算値D[k]/2を減算部94に供給する。
ステップS44において、減算部94は、除算部93から供給される除算値D[k]/2から、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]を減算する。
ステップS45において、減算部94は、ステップS44の処理の結果得られる減算値を量子化情報WL[k]として量子化部14(図5)に出力する。
ステップS46において、NS決定部91は、ステップS45の処理により出力された量子化情報WLに基づいて量子化された量子化スペクトルQS[k]のビット数Nが、量子化部14からフィードバックされたかどうかを判定する。
ステップS46でビット数Nが量子化部14からフィードバックされていないと判定され場合、ビット数Nがフィードバックされるまで待機する。
また、ステップS46でビット数Nが量子化部14からフィードバックされたと判定された場合、ステップS47において、NS決定部91は、そのビット数Nに基づいて、ビットストリームBS´のビット数が所望の範囲内になるかどうかを判定する。
ステップS47でビットストリームBS´のビット数が所望の範囲内にならないと判定された場合、ステップS48において、NS決定部91は、ビットストリームBS´のビット数が所望の範囲内になるように、新たな情報NSを決定する。そして、NS決定部91は、決定された情報NSをノイズシェーピング生成部92に供給し、処理をステップS42に戻す。そして、ビットストリームBS´のビット数が所望の範囲内になるまで、ステップS42乃至S48の処理が繰り返される。
一方、ステップS47でビットストリームBS´のビット数が所望の範囲内になると判定された場合、ステップS49において、NS決定部91は、現在の情報NSを多重化部53(図5)に供給するとともに、量子化部14に出力を指示する。そして処理は図15のステップS15に戻り、ステップS16に進む。
[復号装置の構成例]
図18は、図5の符号化装置50により符号化されたビットストリームBS´を復号する復号装置の構成例を示すブロック図である。
図18に示す構成のうち、図4の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図18の復号装置110の構成は、主に、分解化部21の代わりに分解化部111、エンベロープ強調部112、ノイズシェーピング部113、および分解化部114が設けられている点が図4の構成と異なる。
復号装置110の分解化部111には、符号化装置50により符号化されたビットストリームBS´が入力される。分解化部111は、ビットストリームBS´から、量子化ユニット単位のエンベロープENV[k]と情報NSを分解する。分解化部111は、エンベロープENV[k]をエンベロープ強調部112と逆正規化部23に供給し、情報NSをノイズシェーピング部113に供給する。
エンベロープ強調部112は、図7のエンベロープ強調部51と同様に構成される。エンベロープ強調部112は、分解化部111から供給される量子化ユニット単位のエンベロープENV[k]を用いて量子化ユニット単位の強調エンベロープD[k]を生成し、ノイズシェーピング部113に供給する。
ノイズシェーピング部113は、エンベロープ強調部112から供給される量子化ユニット単位の強調エンベロープD[k]を2で除算する。そして、ノイズシェーピング部113は、その除算値から、分解化部111から供給される情報NSにより特定されるノイズシェーピングG[k]を量子化ユニットごとに減算する。ノイズシェーピング部52は、その結果得られる値を量子化情報WL[k]として分解化部114と逆量子化部22に供給する。なお、ノイズシェーピング部113の詳細については、後述する図19を参照して説明する。
分解化部114は、ノイズシェーピング部113から供給される量子化情報WL[k]に基づいて、符号化装置50から入力されるビットストリームBS´から量子化スペクトルQS[k]を分解する。分解化部114は、その量子化スペクトルQS[k]を逆量子化部22に供給する。
[ノイズシェーピング部の詳細構成例]
図19は、図18のノイズシェーピング部113の詳細構成例を示すブロック図である。
図19に示すように、ノイズシェーピング部113は、ノイズシェーピング生成部121、除算部122、および減算部123により構成される。
ノイズシェーピング生成部121は、図18の分解化部111から供給される情報NSに基づいて、図9のノイズシェーピング生成部92と同様に、各量子化ユニットのノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部121は、生成されたノイズシェーピングG[k]を減算部123に供給する。
除算部122は、図18のエンベロープ強調部112から供給される各量子化ユニットの強調エンベロープD[k]を2で除算し、その結果得られる除算値D[k]/2を減算部123に供給する。
減算部123は、除算部122から供給される除算値D[k]/2から、ノイズシェーピング生成部121から供給されるノイズシェーピングG[k]を量子化ユニットごとに減算する。減算部123は、その結果得られる量子化ユニットごとの減算値を量子化情報WL[k]として分解化部114(図18)に供給する。
[復号装置の処理の説明]
図20は、図18の復号装置110による復号処理を説明するフローチャートである。この復号処理は、例えば、図5の符号化装置50からビットストリームBS´が入力されたとき開始される。
図20のステップS101において、復号装置110の分解化部111(図18)は、符号化装置50から入力されたビットストリームBS´から、量子化ユニット単位のエンベロープENV[k]と情報NSを分解する。分解化部111は、エンベロープENVをエンベロープ強調部112と逆正規化部23に供給し、情報NSをノイズシェーピング部113に供給する。
ステップS102において、エンベロープ強調部112は、分解化部111から供給される量子化ユニット単位のエンベロープENV[k]を用いて、量子化ユニット単位の強調エンベロープD[k]を生成する強調エンベロープ生成処理を行う。この強調エンベロープ生成処理は、図16の強調エンベロープ生成処理と同様であるので、説明は省略する。強調エンベロープ生成処理によって生成された強調エンベロープD[k]は、ノイズシェーピング部113に供給される。
ステップS103において、ノイズシェーピング部113は、エンベロープ強調部112から供給される量子化ユニット単位の強調エンベロープD[k]からノイズシェーピングG[k]を減算するノイズシェーピング処理を行う。このノイズシェーピング処理の詳細は、後述する図21のフローチャートを参照して説明する。
ステップS104において、分解化部114は、ステップS103の処理によってノイズシェーピング部113から供給される量子化情報WL[k]に基づいて、符号化装置50から入力されたビットストリームBS´から量子化スペクトルQS[k]を分解する。分解化部114は、その量子化スペクトルQS[k]を逆量子化部22に供給する。
ステップS105において、逆量子化部22は、分解化部114から供給される量子化情報WLに基づいて量子化スペクトルQS[k]を逆量子化し、その結果得られる正規化スペクトルS1[k]を逆正規化部23に供給する。
ステップS106において、逆正規化部23は、逆量子化部22から供給される正規化スペクトルS1[k]を、分解化部111から供給されるエンベロープENV[k]によって逆正規化し、その結果得られるスペクトルS0を逆MDCT部24に供給する。
ステップS107において、逆MDCT部24は、逆正規化部23から供給される周波数領域信号であるスペクトルS0に対して逆MDCTを行い、時間領域信号である音声のPCM信号を得る。逆MDCT部24は、音声のPCM信号を音声信号として出力し、処理を終了する。
図21は、図20のステップS103のノイズシェーピング処理を説明するフローチャートである。
ステップS121において、ノイズシェーピング部113のノイズシェーピング生成部121(図19)は、図18の分解化部111から供給される情報NSに基づいて、ノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部121は、生成されたノイズシェーピングG[k]を減算部123に供給する。
ステップS122において、除算部122は、図18のエンベロープ強調部112から供給される強調エンベロープD[k]を2で除算し、その結果得られる除算値D[k]/2を減算部123に供給する。
ステップS123において、減算部123は、除算部122から供給される除算値D[k]/2から、ノイズシェーピング生成部121から供給されるノイズシェーピングG[k]を減算する。
ステップS124において、減算部123は、ステップS123の処理により得られる減算値を量子化情報WL[k]として分解化部114(図18)に供給する。そして、処理は、図20のステップS103に戻り、ステップS104に進む。
<第2実施の形態>
[符号化装置の第2実施の形態の構成例]
図22は、本発明を適用した表示装置の第2実施の形態の構成例を示すブロック図である。
図22に示す構成のうち、図5の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図22の符号化装置150の構成は、主に、ノイズシェーピング部52、多重化部53の代わりにノイズシェーピング部151、多重化部152が設けられている点が図5の構成と異なる。符号化装置150は、量子化情報WLの演算を複数種類有し、使用された演算を表す演算情報Pを情報NSとともに情報NS´として符号化結果に含める。
具体的には、符号化装置150のノイズシェーピング部151は、エンベロープ強調部51から供給される量子化ユニット単位の強調エンベロープD[k]と、情報NSにより特定される量子化ユニット単位のノイズシェーピングG[k]とを用いて、所定の演算により量子化情報WL[k]を求める。
また、ノイズシェーピング部151は、エンベロープ強調部51から供給される強調エンベロープD[k]が供給された場合、その強調エンベロープD[k]と多重化部152により生成されるビットストリームBS´´のビット数の所望の範囲とに基づいて、量子化情報WLの演算を用意されている複数の中から選択する。また、ノイズシェーピング部151は、選択された演算に対応付けて予め設定されている情報NSの初期値を現在の情報NSに設定する。
さらに、ノイズシェーピング部151は、前回の量子化情報WLに基づいて正規化スペクトルS1が量子化された結果得られる量子化スペクトルQS[k]のビット数Nが量子化部14からフィードバックされた場合、そのビット数Nに基づいて、ビットストリームBS´´のビット数が所望の範囲内になるかどうかを判定する。ノイズシェーピング部151は、ビットストリームBS´´のビット数が所望の範囲内にないと判定された場合、ビットストリームBS´´のビット数が所望の範囲内になるように、情報NSを更新する。これにより、新たな量子化情報WLが量子化部14に供給される。
一方、ビットストリームBS´´のビット数が所望の範囲内にあると判定された場合、ノイズシェーピング部151は、量子化部14に出力を指示するとともに、現在の情報NSと量子化情報WLの演算を表す演算情報Pを情報NS´として多重化部152に供給する。
多重化部152は、正規化部12から供給されるエンベロープENV[k]、ノイズシェーピング部151から供給される情報NS´、および量子化部14から供給される量子化スペクトルQS[k]を多重化してビットストリームBS´´を生成する。多重化部152は、そのビットストリームBS´´を符号化結果として出力する。
[ビットストリームの構成例]
図23は、図22の多重化部152により生成されるビットストリームBS´´の構成例を示す図である。
図23に示すように、ビットストリームBS´´は、スペクトルの上限値などを含むヘッダHeader、エンベロープENV[k]、情報NS´、および量子化スペクトルQS[k]により構成される。
[ノイズシェーピング部の詳細構成例]
図24は、図22のノイズシェーピング部151の詳細構成例を示すブロック図である。
図24に示す構成のうち、図9の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図24のノイズシェーピング部151の構成は、主に、NS決定部91の代わりにNS´決定部161が設けられている点、新たにスイッチ部162が設けられている点、および、除算部93と減算部94の代わりにWL演算部163−1乃至163−4が設けられている点が図9の構成と異なる。
ノイズシェーピング部151のNS´決定部161は、図22のエンベロープ強調部51から各量子化ユニットの強調エンベロープD[k]が供給された場合、その強調エンベロープD[k]とビットストリームBS´´のビット数の所望の範囲に基づいて、WL演算部163−1乃至163−4に対応する量子化情報WLの演算のいずれかを選択する。そして、NS´決定部161は、選択された演算を表す演算情報Pをスイッチ部162に供給する。また、NS´決定部161は、その演算情報Pが表す演算に対応付けて予め設定されている情報NSの初期値を現在の情報NSに決定し、ノイズシェーピング生成部92に供給する。
さらに、NS´決定部161は、前回の情報NSと演算情報Pで特定される量子化情報WLに基づいて量子化された量子化スペクトルQS[k]のビット数Nが、図22の量子化部14からフィードバックされた場合、そのビット数Nに基づいて、ビットストリームBS´´のビット数が所望の範囲内になるかどうかを判定する。NS´決定部161は、ビットストリームBS´´のビット数が所望の範囲内にならないと判定された場合、ビットストリームBS´´のビット数が所望の範囲内になるように、情報NSを新たに決定し、ノイズシェーピング生成部92に供給する。
一方、ビットストリームBS´´のビット数が所望の範囲内になると判定された場合、NS´決定部161は、現在の情報NSと演算情報Pを情報NS´として多重化部152(図22)に供給するとともに、量子化部14に出力を指示する。
以上のように、NS´決定部161は、量子化情報WLの演算の選択によってビットストリームBS´´の大まかな制御を行った後、情報NSによって細かな制御を行う。なお、量子化部14からビット数Nがフィードバックされた場合、そのビット数Nに基づいて情報NSだけでなく、演算情報Pも更新されるようにしてもよい。
スイッチ部162(選択手段)は、NS´決定部161から供給される演算情報Pに基づいて、WL演算部163−1乃至163−4の中から、その演算情報Pが表す演算で量子化情報WLを求めるWL演算部を選択する。スイッチ部162は、選択されたWL演算部163−1乃至163−4のいずれかにノイズシェーピング生成部92により生成されたノイズシェーピングG[k]を供給することにより、演算を行わせる。
WL演算部163−1は、図22のエンベロープ強調部51から供給される強調エンベロープD[k]から、スイッチ部162から供給されるノイズシェーピングG[k]を減算し、その減算値を量子化情報WL[k]とする。即ち、WL演算部163−1は、WL[k]=D[k]-G[k]という演算で量子化情報WL[k]を求める。WL演算部163−1は、その量子化情報WL[k]を量子化部14(図22)に供給する。
WL演算部163−2は、図9の除算部93と減算部94を有する。WL演算部163−2は、エンベロープ強調部51から供給される強調エンベロープD[k]を2で除算する。そして、WL演算部163−2は、その結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算し、その減算値を量子化情報WL[k]とする。即ち、WL演算部163−2は、WL[k]=D[k]/2-G[k]という演算で量子化情報WL[k]を求める。WL演算部163−2は、その量子化情報WL[k]を量子化部14に供給する。
WL演算部163−3は、エンベロープ強調部51から供給される強調エンベロープD[k]を3で除算する。そして、WL演算部163−3は、その結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算し、その減算値を量子化情報WL[k]とする。即ち、WL演算部163−3は、WL[k]=D[k]/3-G[k]という演算で量子化情報WL[k]を求める。WL演算部163−3は、その量子化情報WL[k]を量子化部14に供給する。
WL演算部163−4は、エンベロープ強調部51から供給される強調エンベロープD[k]を4で除算する。そして、WL演算部163−4は、その結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算し、その減算値を量子化情報WL[k]とする。即ち、WL演算部163−4は、WL[k]=D[k]/4-G[k]という演算で量子化情報WL[k]を生成する。WL演算部163−4は、その量子化情報WL[k]を量子化部14に供給する。
[量子化情報の演算を複数種類用意することによる効果]
図25は、量子化情報WLの演算を複数種類用意することによる効果を説明する図である。
図25では、図8Cに示した強調エンベロープD[i]乃至D[i+4]がノイズシェーピング部151に入力され、図10Bに示したノイズシェーピングG[k]がノイズシェーピング部151で生成される場合について説明する。
この場合、図25Aに示すように、WL演算部163−1により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,7(=9-2),17(=20-3),5(=9-4),1になる。従って、量子化情報WL[i]乃至WL[i+4]の最大値は17であり、量子化情報WL[i]乃至WL[i+4]の平均値は、6.2(=(1+7+17+5+1)/5となる。ここで、各量子化ユニットが2本のスペクトルにより構成されるとすると、インデックスi乃至i+4の量子化ユニットのスペクトルの総使用ビット数は62(=6.2×2×5)ビットとなる。
また、図25Bに示すように、WL演算部163−2により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,2(≒9/2-2),7(=20/2-3),1,1になる。従って、図25Bに示すように、WL演算部163−2により生成される量子化情報WL[i]乃至WL[i+4]は、図25Aの場合に比べて平坦化している。また、量子化情報WL[i]乃至WL[i+4]の最大値は7であり、量子化情報WL[i]乃至WL[i+4]の平均値は、2.4(=(1+2+7+1+1)/5となる。ここで、各量子化ユニットが2本のスペクトルにより構成されるとすると、インデックスi乃至i+4の量子化ユニットのスペクトルの総使用ビット数は24(=2.4×2×5)ビットとなる。
さらに、図25Cに示すように、WL演算部163−3により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,1(=9/3-2),3(=20/3-3),1,1になる。従って、図25Cに示すように、WL演算部163−3により生成される量子化情報WL[i]乃至WL[i+4]は、図25Bの場合に比べてさらに平坦化している。また、量子化情報WL[i]乃至WL[i+4]の最大値は3であり、量子化情報WL[i]乃至WL[i+4]の平均値は、1.4(=(1+1+3+1+1)/5となる。ここで、各量子化ユニットが2本のスペクトルにより構成されるとすると、インデックスi乃至i+4の量子化ユニットのスペクトルの総使用ビット数は14(=1.4×2×5)ビットとなる。
また、図25Dに示すように、WL演算部163−4により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,1,2(=20/4-3),1,1になる。従って、図25Dに示すように、WL演算部163−4により生成される量子化情報WL[i]乃至WL[i+4]は、図25Cの場合に比べてさらに平坦化している。量子化情報WL[i]乃至WL[i+4]の最大値は2であり、量子化情報WL[i]乃至WL[i+4]の平均値は、1.2(=(1+1+2+1+1)/5となる。ここで、各量子化ユニットが2本のスペクトルにより構成されるとすると、インデックスi乃至i+4の量子化ユニットのスペクトルの総使用ビット数は12(=1.2×2×5)ビットとなる。
以上のように、符号化装置150は、量子化情報WLの演算として上述した4種類の演算を用意することで、ノイズシェーピングGを変更せずに、ビット数Nを変化させることができる。その結果、ノイズシェーピングGのみを用いてビット数Nを調整する場合に比べて、ビット数Nの調整の自由度が向上する。
また、WL演算部163−1、WL演算部163−2、WL演算部163−3、WL演算部163−4順で、スペクトルが集中している量子化ユニットにビットがより重点的に配分される。さらに、WL演算部163−4、WL演算部163−3、WL演算部163−2、WL演算部163−1の順で、ビット配分をより平坦化することができる。但し、符号化装置150では、エンベロープENV[k]が強調されるため、ビット配分がより平坦化される場合であっても、スペクトルが集中している量子化ユニットには、周辺の量子化ユニットに比べてより多くのビットが配分される。よって、符号化装置150は、量子化情報WLの演算として上述した4種類の演算を用意することで、スペクトルが集中している量子化ユニットへのビット配分の集中度を制御することができる。
以上のように、符号化装置150では、ビット数Nの調整の自由度が向上するとともに、スペクトルが集中している量子化ユニットへのビット配分の集中度を制御することができるので、量子化情報WL[k]を直接制御する場合と同様なビット調整を行うことが可能となる。即ち、符号化装置150では、符号化装置50と同様に音声信号の符号化による音質劣化を低減するとともに、量子化情報WL[k]を直接制御する場合と同様なビット調整を行うことが可能となる。
[エンベロープを強調することによる効果の説明]
図26は、エンベロープENVを強調することによる効果を説明する図である。
図26では、図8Aに示したエンベロープENV[i]乃至ENV[i+4]が抽出される場合について説明する。この場合、図26Aに示すように、WL演算部163−1により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,3(=5-2),7(=10-3),1(=5-4),1になる。また、図26Bに示すように、WL演算部163−2により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,1,2(=10/2-3),1,1になる。図26Cに示すように、WL演算部163−3により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,1,1,1,1になる。図26Dに示すように、WL演算部163−4により生成される量子化情報WL[i]乃至WL[i+4]は、順に、1,1,1,1,1になる。
以上のように、エンベロープENVが強調されずにそのまま用いられると、隣接する量子化ユニットの量子化情報WL間の差が小さくなるため、ビット配分が平坦化する。従って、量子化情報WLの演算の種類を変化させても、ビット調整の自由度は向上しにくい。
[符号化装置の処理の説明]
図22の符号化装置150による符号化処理は、図15のステップS15のノイズシェーピング処理を除いて、図15の符号化処理と同様であるので、ノイズシェーピング処理についてのみ説明する。
図27は、図22の符号化装置150によるノイズシェーピング処理を説明するフローチャートである。
図27のステップS151において、ノイズシェーピング部151のNS´決定部161(図24)は、図22のエンベロープ強調部51から供給される強調エンベロープD[k]に基づいて、情報NSと演算を決定する。
具体的には、NS´決定部161は、強調エンベロープD[k]とビットストリームBS´´のビット数の所望の範囲に基づいて、WL演算部163−1乃至163−4に対応する量子化情報WLの演算のいずれかを選択する。そして、NS´決定部161は、選択された演算を表す演算情報Pをスイッチ部162に供給する。また、NS´決定部161は、その演算情報Pが表す演算に対応付けて予め設定されている情報NSの初期値を現在の情報NSに決定し、ノイズシェーピング生成部92に供給する。
ステップS152において、ノイズシェーピング生成部92は、NS´決定部161から供給される情報NSに基づいて、ノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部92は、生成されたノイズシェーピングG[k]をスイッチ部162に供給する。
ステップS153において、スイッチ部162は、NS´決定部161から供給される演算情報Pが表す演算がWL演算部163−1で行われる演算であるかどうかを判定する。
ステップS153で演算情報Pが表す演算がWL演算部163−1で行われる演算であると判定された場合、スイッチ部162は、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]をWL演算部163−1に供給する。そして、ステップS154において、WL演算部163−1は、エンベロープ強調部51から供給される強調エンベロープD[k]から、スイッチ部162から供給されるノイズシェーピングG[k]を減算する。そして、WL演算部163−1は、その減算値を量子化情報WL[k]として量子化部14(図22)に供給し、処理をステップS163に進める。
一方、ステップS153で演算情報Pが表す演算がWL演算部163−1で行われる演算ではないと判定された場合、ステップS155において、スイッチ部162は、NS´決定部161から供給される演算情報Pが表す演算がWL演算部163−2で行われる演算であるかどうかを判定する。
ステップS155で演算情報Pが表す演算がWL演算部163−2で行われる演算であると判定された場合、スイッチ部162は、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]をWL演算部163−2に供給する。そして、ステップS156において、WL演算部163−2は、エンベロープ強調部51から供給される強調エンベロープD[k]を2で除算する。
ステップS157において、WL演算部163−2は、ステップS156の処理の結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算する。そして、WL演算部163−2は、その減算値を量子化情報WL[k]として量子化部14に供給し、処理をステップS163に進める。
また、ステップS155で演算情報Pが表す演算がWL演算部163−2で行われる演算ではないと判定された場合、ステップS158において、スイッチ部162は、NS´決定部161から供給される演算情報Pが表す演算がWL演算部163−3で行われる演算であるかどうかを判定する。
ステップS158で演算情報Pが表す演算がWL演算部163−3で行われる演算であると判定された場合、スイッチ部162は、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]をWL演算部163−3に供給する。そして、ステップS159において、WL演算部163−3は、エンベロープ強調部51から供給される強調エンベロープD[k]を3で除算する。
ステップS160において、WL演算部163−3は、ステップS159の処理の結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算する。そして、WL演算部163−3は、その減算値を量子化情報WL[k]として量子化部14に供給し、処理をステップS163に進める。
一方、ステップS158で演算情報Pが表す演算がWL演算部163−3で行われる演算ではないと判定された場合、即ち演算情報Pが表す演算がWL演算部163−4で行われる演算である場合、スイッチ部162は、ノイズシェーピング生成部92から供給されるノイズシェーピングG[k]をWL演算部163−4に供給する。そして、ステップS161において、WL演算部163−4は、エンベロープ強調部51から供給される強調エンベロープD[k]を4で除算する。
ステップS162において、WL演算部163−4は、ステップS161の処理の結果得られる除算値から、スイッチ部162から供給されるノイズシェーピングG[k]を減算する。そして、WL演算部163−4は、その減算値を量子化情報WL[k]として量子化部14に供給し、処理をステップS163に進める。
ステップS163において、NS´決定部161は、ステップS154,S157,S160、またはS162の処理により量子化部14に供給された量子化情報WLに基づいて量子化された量子化スペクトルQS[k]のビット数Nが、量子化部14からフィードバックされたかどうかを判定する。
ステップS163でビット数Nが量子化部14からフィードバックされていないと判定され場合、ビット数Nがフィードバックされるまで待機する。
また、ステップS163でビット数Nが量子化部14からフィードバックされたと判定された場合、ステップS164において、NS´決定部161は、そのビット数Nに基づいて、ビットストリームBS´´のビット数が所望の範囲内になるかどうかを判定する。
ステップS164でビットストリームBS´´のビット数が所望の範囲内にならないと判定された場合、ステップS165において、NS´決定部161は、ビットストリームBS´´のビット数が所望の範囲内になるように、新たな情報NSを決定する。そして、NS´決定部161は、決定された情報NSをノイズシェーピング生成部92に供給し、処理をステップS152に戻す。そして、ビットストリームBS´´のビット数が所望の範囲内になるまで、ステップS152乃至S165の処理が繰り返される。
一方、ステップS164でビットストリームBS´´のビット数が所望の範囲内になると判定された場合、ステップS166において、NS´決定部161は、現在の情報NSと演算情報Pを情報NS´として多重化部152(図22)に供給するとともに、量子化部14に出力を指示する。そして処理は図15のステップS15に戻り、ステップS16に進む。
[復号装置の構成例]
図28は、図22の符号化装置150により符号化されたビットストリームBS´´を復号する復号装置の構成例を示すブロック図である。
図28に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図28の復号装置210の構成は、主に、分解化部111、ノイズシェーピング部113、分解化部114の代わりに分解化部211、ノイズシェーピング部212、分解化部213が設けられている点が図18の構成と異なる。
復号装置210の分解化部211には、符号化装置150により符号化されたビットストリームBS´´が入力される。分解化部211は、ビットストリームBS´´から、量子化ユニット単位のエンベロープENV[k]と情報NS´を分解する。分解化部211は、エンベロープENVをエンベロープ強調部112と逆正規化部23に供給し、情報NS´をノイズシェーピング部212に供給する。
ノイズシェーピング部212は、エンベロープ強調部112により生成された量子化ユニット単位の強調エンベロープD[k]と、分解化部211からの情報NS´のうちのNSにより特定される量子化ユニット単位のノイズシェーピングG[k]を用いて、情報NS´のうちの演算情報Pが表す演算を行うことにより、量子化情報WL[k]を生成する。ノイズシェーピング部212は、その量子化情報WL[k]を分解化部213と逆量子化部22に供給する。なお、ノイズシェーピング部212の詳細については、後述する図29を参照して説明する。
分解化部213は、ノイズシェーピング部212から供給される量子化情報WL[k]に基づいて、符号化装置150から入力されるビットストリームBS´´から量子化スペクトルQS[k]を分解する。分解化部213は、その量子化スペクトルQS[k]を逆量子化部22に供給する。
[ノイズシェーピング部の詳細構成例]
図29は、図28のノイズシェーピング部212の詳細構成例を示すブロック図である。
図29に示す構成のうち、図19の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図29のノイズシェーピング部212の構成は、主に、新たにスイッチ部221が設けられている点、除算部122と減算部123の代わりにWL演算部222−1乃至222−4が設けられている点が図19の構成と異なる。
スイッチ部221(選択手段)は、図24のスイッチ部162と同様に構成される。スイッチ部221には、分解化部211から供給される情報NS´のうちの情報NSに基づいてノイズシェーピング生成部121により生成されたノイズシェーピングG[k]が入力される。また、スイッチ部221には、分解化部211から供給される情報NS´のうちの演算情報Pが入力される。スイッチ部221は、入力された演算情報Pに基づいて、WL演算部222−1乃至222−4の中から、その演算情報Pが表す演算で量子化情報WLを求めるWL演算部を選択する。スイッチ部221は、選択されたWL演算部222−1乃至222−4のいずれかにノイズシェーピングG[k]を供給することにより、演算を行わせる。
WL演算部222−1乃至222−4は、図24のWL演算部163−1乃至163−4と同様に構成されるので、詳細な説明は省略する。
[復号装置の処理の説明]
図28の復号装置210による復号処理は、図20のステップS103のノイズシェーピング処理を除いて、図20の復号処理と同様であるので、ノイズシェーピング処理についてのみ説明する。
図30は、図28の復号装置210によるノイズシェーピング処理を説明するフローチャートである。
図30のステップS201において、ノイズシェーピング部212のノイズシェーピング生成部121(図29)は、図28の分解化部211から供給される情報NS´のうちの情報NSに基づいて、ノイズシェーピングG[k]を生成する。そして、ノイズシェーピング生成部121は、生成されたノイズシェーピングG[k]をスイッチ部221に供給する。
ステップS202乃至S211の処理は、図24のWL演算部163−1乃至163−4の代わりにWL演算部222−1乃至222−4により行われる図27のステップS153乃至S162の処理であるので、説明は省略する。なお、ステップS202,S204、およびS207の判定対象である演算情報Pは、分解化部211から供給される情報NS´のうちの演算情報Pである。
なお、上述した説明では、最低値Lが最初の量子化ユニットのノイズシェーピングGとされ、最高値Hが最後の量子化ユニットのノイズシェーピングGとされたが、最低値Lと最高値Hに対応する量子化ユニットとして任意の量子化ユニットが設定されるようにしてもよい。この場合、情報NS(NS´)には、最低値Lに対応する量子化ユニットのインデックスを表す位置情報Xと、最高値Hに対応する量子化ユニットのインデックスを表す位置情報Yも含められる。これにより、ビット配分の自由度をより向上させることができる。
また、量子化情報WLの演算の種類は、上述した4種類に限定されない。また、量子化情報WLの演算ではなく、ノイズシェーピングGの演算が複数種類用意され、使用された演算を表す情報がNS(NS´)に含められるようにしてもよい。また、強調エンベロープDの生成方法が複数用意され、使用された生成方法を表す情報が情報NS(NS´)に含められるようにしてもよい。この場合、例えば、量子化情報WLの演算の種類によって強調エンベロープDの生成方法が選択される。
また、量子化情報WLの演算の種類、ノイズシェーピングGの演算の種類、および強調エンベロープDの生成方法の全てが複数種類用意され、使用された演算および生成方法を表す情報が情報NS(NS´)に含められるようにしてもよい。
情報NS(NS´)を伝送するために必要なビット数が、量子化情報WLを伝送するために必要なビット数NWLより十分小さくなるようであれば、情報NS(NS´)に含まれる情報は、上述した情報に限定されない。
<第3実施の形態>
[本発明を適用したコンピュータの説明]
次に、上述した一連の符号化装置50(150)の処理および復号装置110(210)の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の符号化装置50(150)の処理および復号装置110(210)の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図31は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部308やROM(Read Only Memory)302に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア311に格納(記録)しておくことができる。このようなリムーバブルメディア311は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア311としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア311からドライブ310を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部308にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)301を内蔵しており、CPU301には、バス304を介して、入出力インタフェース305が接続されている。
CPU301は、入出力インタフェース305を介して、ユーザによって、入力部306が操作等されることにより指令が入力されると、それに従って、ROM302に格納されているプログラムを実行する。あるいは、CPU301は、記憶部308に格納されたプログラムを、RAM(Random Access Memory)303にロードして実行する。
これにより、CPU301は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU301は、その処理結果を、必要に応じて、例えば、入出力インタフェース305を介して、出力部307から出力、あるいは、通信部309から送信、さらには、記憶部308に記録等させる。
なお、入力部306は、キーボードや、マウス、マイク等で構成される。また、出力部307は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
12 正規化部, 14 量子化部, 22 逆量子化部, 23 逆正規化部, 50 符号化装置, 51 エンベロープ強調部, 52 ノイズシェーピング部, 53 多重化部, 91 NS決定部, 110 復号装置, 111 分解化部, 112 エンベロープ強調部, 113 ノイズシェーピング部, 114 分解化部, 150 符号化装置, 151 ノイズシェーピング部, 152 多重化部, 161 NS´決定部, 162 スイッチ部, 163−1乃至163−4 WL演算部, 210 復号装置, 211分解化部, 212 ノイズシェーピング部, 213 分解化部, 221 スイッチ部, 222−1乃至222−4 WL演算部

Claims (14)

  1. 音声信号のスペクトルからエンベロープを抽出し、そのエンベロープを用いて前記スペクトルを正規化する正規化手段と、
    前記エンベロープを強調するエンベロープ強調手段と、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい値で除算し、その除算結果から所定の情報により特定されるノイズシェーピングを減算するノイズシェーピング手段と、
    前記ノイズシェーピング手段による減算結果を量子化ビット数として、その量子化ビット数に基づいて前記正規化手段により正規化された前記スペクトルを量子化する量子化手段と、
    前記所定の情報、前記量子化手段により量子化された前記スペクトル、および前記エンベロープを多重化する多重化手段と
    を備える符号化装置。
  2. 前記所定の情報は、前記ノイズシェーピングの最低値と最高値を表す情報である
    請求項1に記載の符号化装置。
  3. 前記エンベロープ強調手段により強調された前記エンベロープに基づいて、前記所定の情報を決定する情報決定手段
    をさらに備える
    請求項1に記載の符号化装置。
  4. 前記情報決定手段は、前回の前記量子化ビット数に基づいて前記量子化手段により量子化された前記スペクトルのビット数に基づいて、前記所定の情報を更新する
    請求項3に記載の符号化装置。
  5. 前記ノイズシェーピング手段は、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい第1の値で除算し、その除算結果から前記ノイズシェーピングを減算する第1の演算を行う第1の演算手段と、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい前記第1の値と異なる第2の値で除算し、その除算結果から前記ノイズシェーピングを減算する第2の演算を行う第2の演算手段と、
    前記第1の演算手段または前記第2の演算手段を選択し、選択された前記第1の演算手段または前記第2の演算手段に演算を行わせる選択手段と
    を備え、
    前記多重化手段は、前記所定の情報、前記スペクトル、前記エンベロープ、および前記選択手段により選択された前記第1の演算手段に対応する前記第1の演算または前記第2の演算手段に対応する前記第2の演算を表す演算情報を多重化する
    請求項1に記載の符号化装置。
  6. 前記エンベロープ強調手段により強調された前記エンベロープに基づいて、前記所定の情報と前記演算情報を決定する情報決定手段
    をさらに備え、
    前記選択手段は、前記演算情報に基づいて前記第1の演算または前記第2の演算を選択する
    請求項5に記載の符号化装置。
  7. 前記情報決定手段は、前回の前記量子化ビット数に基づいて前記量子化手段により量子化された前記スペクトルのビット数に基づいて、少なくとも前記所定の情報を更新する
    請求項6に記載の符号化装置。
  8. 符号化装置が、
    音声信号のスペクトルからエンベロープを抽出し、そのエンベロープを用いて前記スペクトルを正規化する正規化ステップと、
    前記エンベロープを強調するエンベロープ強調ステップと、
    前記エンベロープ強調ステップの処理により強調された前記エンベロープを1より大きい値で除算し、その除算結果から所定の情報により特定されるノイズシェーピングを減算するノイズシェーピングステップと、
    前記ノイズシェーピングステップの処理による減算結果を量子化ビット数として、その量子化ビット数に基づいて前記正規化ステップの処理により正規化された前記スペクトルを量子化する量子化ステップと、
    前記所定の情報、前記量子化ステップの処理により量子化された前記スペクトル、および前記エンベロープを多重化する多重化ステップと
    を含む符号化方法。
  9. コンピュータに、
    音声信号のスペクトルからエンベロープを抽出し、そのエンベロープを用いて前記スペクトルを正規化する正規化ステップと、
    前記エンベロープを強調するエンベロープ強調ステップと、
    前記エンベロープ強調ステップの処理により強調された前記エンベロープを1より大きい値で除算し、その除算結果から所定の情報により特定されるノイズシェーピングを減算するノイズシェーピングステップと、
    前記ノイズシェーピングステップの処理による減算結果を量子化ビット数として、その量子化ビット数に基づいて前記正規化ステップの処理により正規化された前記スペクトルを量子化する量子化ステップと、
    前記所定の情報、前記量子化ステップの処理により量子化された前記スペクトル、および前記エンベロープを多重化する多重化ステップと
    を含む処理を実行させるためのプログラム。
  10. 多重化されている所定の情報、量子化された音声信号のスペクトル、および前記スペクトルのエンベロープから、前記所定の情報と前記エンベロープを分解する情報分解化手段と、
    前記エンベロープを強調するエンベロープ強調手段と、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい値で除算し、その除算結果から前記所定の情報により特定されるノイズシェーピングを減算するノイズシェーピング手段と、
    前記ノイズシェーピング手段による減算結果を量子化ビット数として用いて、多重化されている前記所定の情報、量子化された前記スペクトル、および前記エンベロープから、量子化された前記スペクトルを分解するスペクトル分解化手段と、
    前記量子化ビット数に基づいて、量子化された前記スペクトルを逆量子化する逆量子化手段と、
    前記エンベロープを用いて、前記逆量子化手段により逆量子化された前記スペクトルを逆正規化する逆正規化手段と
    を備える復号装置。
  11. 前記所定の情報は、前記ノイズシェーピングの最低値と最高値を表す情報である
    請求項10に記載の復号装置。
  12. 前記情報分解化手段は、多重化されている前記所定の情報、前記スペクトル、前記エンベロープ、および前記ノイズシェーピング手段で行われる演算を表す演算情報から、前記所定の情報、前記エンベロープ、および前記演算情報を分解し、
    前記ノイズシェーピング手段は、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい第1の値で除算し、その除算結果から前記ノイズシェーピングを減算する第1の演算を行う第1の演算手段と、
    前記エンベロープ強調手段により強調された前記エンベロープを1より大きい前記第1の値と異なる第2の値で除算し、その除算結果から前記ノイズシェーピングを減算する第2の演算を行う第2の演算手段と、
    前記演算情報に基づいて前記第1の演算手段または前記第2の演算手段を選択し、選択された前記第1の演算手段または前記第2の演算手段に演算を行わせる選択手段と
    を備える
    請求項10に記載の符号化装置。
  13. 復号装置が、
    多重化されている所定の情報、量子化された音声信号のスペクトル、および前記スペクトルのエンベロープから、前記所定の情報と前記エンベロープを分解する情報分解化ステップと、
    前記エンベロープを強調するエンベロープ強調ステップと、
    前記エンベロープ強調ステップの処理により強調された前記エンベロープを1より大きい値で除算し、その除算結果から前記所定の情報により特定されるノイズシェーピングを減算するノイズシェーピングステップと、
    前記ノイズシェーピングステップの処理による減算結果を量子化ビット数として用いて、多重化されている前記所定の情報、量子化された前記スペクトル、および前記エンベロープから、量子化された前記スペクトルを分解するスペクトル分解化ステップと、
    前記量子化ビット数に基づいて、量子化された前記スペクトルを逆量子化する逆量子化ステップと、
    前記エンベロープを用いて、前記逆量子化ステップの処理により逆量子化された前記スペクトルを逆正規化する正規化ステップと
    を含む復号方法。
  14. コンピュータに、
    多重化されている所定の情報、量子化された音声信号のスペクトル、および前記スペクトルのエンベロープから、前記所定の情報と前記エンベロープを分解する情報分解化ステップと、
    前記エンベロープを強調するエンベロープ強調ステップと、
    前記エンベロープ強調ステップの処理により強調された前記エンベロープを1より大きい値で除算し、その除算結果から前記所定の情報により特定されるノイズシェーピングを減算するノイズシェーピングステップと、
    前記ノイズシェーピングステップの処理による減算結果を量子化ビット数として用いて、多重化されている前記所定の情報、量子化された前記スペクトル、および前記エンベロープから、量子化された前記スペクトルを分解するスペクトル分解化ステップと、
    前記量子化ビット数に基づいて、量子化された前記スペクトルを逆量子化する逆量子化ステップと、
    前記エンベロープを用いて、前記逆量子化ステップの処理により逆量子化された前記スペクトルを逆正規化する正規化ステップと
    を含む処理を実行させるためのプログラム。
JP2010061171A 2010-03-17 2010-03-17 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム Expired - Fee Related JP5316896B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2010061171A JP5316896B2 (ja) 2010-03-17 2010-03-17 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
EP11756122.5A EP2525356B1 (en) 2010-03-17 2011-03-08 Audio encoding device and audio encoding method, audio decoding device and audio decoding method, and program
EP16160573.8A EP3070712B1 (en) 2010-03-17 2011-03-08 Encoding device, encoding method, and program
PCT/JP2011/055294 WO2011114933A1 (ja) 2010-03-17 2011-03-08 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CN201180013285.7A CN102792371B (zh) 2010-03-17 2011-03-08 编码设备和编码方法、以及解码设备和解码方法
RU2012138396/08A RU2546324C2 (ru) 2010-03-17 2011-03-08 Кодирущее устройство и способ кодирования, декодирующее устройство и способ декодирования, и программа
US13/583,994 US8892429B2 (en) 2010-03-17 2011-03-08 Encoding device and encoding method, decoding device and decoding method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010061171A JP5316896B2 (ja) 2010-03-17 2010-03-17 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2011197106A true JP2011197106A (ja) 2011-10-06
JP5316896B2 JP5316896B2 (ja) 2013-10-16

Family

ID=44649031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010061171A Expired - Fee Related JP5316896B2 (ja) 2010-03-17 2010-03-17 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Country Status (6)

Country Link
US (1) US8892429B2 (ja)
EP (2) EP2525356B1 (ja)
JP (1) JP5316896B2 (ja)
CN (1) CN102792371B (ja)
RU (1) RU2546324C2 (ja)
WO (1) WO2011114933A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016102860A (ja) * 2014-11-27 2016-06-02 日本放送協会 音声加工装置、及びプログラム
JP2016538589A (ja) * 2013-12-02 2016-12-08 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法および装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140130248A (ko) * 2012-03-29 2014-11-07 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
RU2651187C2 (ru) 2012-06-28 2018-04-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей
US9378748B2 (en) * 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
EP3121813B1 (en) * 2013-01-29 2020-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling without side information for celp-like coders
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
DK2981958T3 (en) * 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
EP2830060A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0671507B2 (ja) 1989-12-18 1994-09-14 工業技術院長 片持ち支持のワークに縫い目を形成する縫製装置
US5479560A (en) 1992-10-30 1995-12-26 Technology Research Association Of Medical And Welfare Apparatus Formant detecting device and speech processing apparatus
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
DE19613643A1 (de) * 1996-04-04 1997-10-09 Fraunhofer Ges Forschung Verfahren zum Codieren eines mit einer niedrigen Abtastrate digitalisierten Audiosignals
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US7103539B2 (en) * 2001-11-08 2006-09-05 Global Ip Sound Europe Ab Enhanced coded speech
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
AU2007332508B2 (en) * 2006-12-13 2012-08-16 Iii Holdings 12, Llc Encoding device, decoding device, and method thereof
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016538589A (ja) * 2013-12-02 2016-12-08 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法および装置
US9754594B2 (en) 2013-12-02 2017-09-05 Huawei Technologies Co., Ltd. Encoding method and apparatus
US10347257B2 (en) 2013-12-02 2019-07-09 Huawei Technologies Co., Ltd. Encoding method and apparatus
US11289102B2 (en) 2013-12-02 2022-03-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
JP2016102860A (ja) * 2014-11-27 2016-06-02 日本放送協会 音声加工装置、及びプログラム

Also Published As

Publication number Publication date
RU2546324C2 (ru) 2015-04-10
JP5316896B2 (ja) 2013-10-16
EP3070712B1 (en) 2020-04-29
CN102792371A (zh) 2012-11-21
EP3070712A1 (en) 2016-09-21
CN102792371B (zh) 2014-10-29
WO2011114933A1 (ja) 2011-09-22
RU2012138396A (ru) 2014-03-20
EP2525356B1 (en) 2016-07-06
US8892429B2 (en) 2014-11-18
US20130006647A1 (en) 2013-01-03
EP2525356A1 (en) 2012-11-21
EP2525356A4 (en) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5316896B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US10236015B2 (en) Encoding device and method, decoding device and method, and program
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
MX2008014222A (es) Codificacion de señal de informacion.
US8606567B2 (en) Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program
CN105144288A (zh) 高级量化器
EP1170727A2 (en) Audio encoder using psychoacoustic bit allocation
CA2770622C (en) Frequency band scale factor determination in audio encoding based upon frequency band signal energy
WO2006001159A1 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP5201375B2 (ja) チャネル間及び一時的冗長度抑圧を用いた音声信号符号化
JPH03121633A (ja) 可聴音信号符号化方法
JP6061121B2 (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
CA3080907C (en) Controlling bandwidth in encoders and/or decoders
JP6492915B2 (ja) 符号化装置、符号化方法、及びプログラム
JP2012022021A (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP5098492B2 (ja) 信号処理装置及び信号処理方法、並びにプログラム
JP2005284301A (ja) 復号方法及び装置、並びにプログラム
JP2002141805A (ja) 符号化器および通信デバイス
JP6586804B2 (ja) 符号化装置、符号化方法、及びプログラム
JP2001282288A (ja) オーディオ信号の符号化装置及び処理方法
JP2004180058A (ja) デジタルデータの符号化装置および符号化方法
JP2009103974A (ja) マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130626

R151 Written notification of patent or utility model registration

Ref document number: 5316896

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees