JPWO2006049204A1 - 符号化装置、復号化装置、符号化方法及び復号化方法 - Google Patents

符号化装置、復号化装置、符号化方法及び復号化方法 Download PDF

Info

Publication number
JPWO2006049204A1
JPWO2006049204A1 JP2006542421A JP2006542421A JPWO2006049204A1 JP WO2006049204 A1 JPWO2006049204 A1 JP WO2006049204A1 JP 2006542421 A JP2006542421 A JP 2006542421A JP 2006542421 A JP2006542421 A JP 2006542421A JP WO2006049204 A1 JPWO2006049204 A1 JP WO2006049204A1
Authority
JP
Japan
Prior art keywords
spectrum
encoding
parameter
unit
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006542421A
Other languages
English (en)
Other versions
JP4977471B2 (ja
Inventor
押切 正浩
正浩 押切
江原 宏幸
宏幸 江原
吉田 幸司
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006542421A priority Critical patent/JP4977471B2/ja
Publication of JPWO2006049204A1 publication Critical patent/JPWO2006049204A1/ja
Application granted granted Critical
Publication of JP4977471B2 publication Critical patent/JP4977471B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

原信号を第1レイヤと第2レイヤとで符号化するスケーラブル符号化において、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号が得られる符号化装置、復号化装置、符号化方法及び復号化方法を提供する。符号化装置において、スペクトル残差形状符号帳(305)は複数のスペクトル残差形状ベクトルの候補を格納し、スペクトル残差ゲイン符号帳(307)は複数のスペクトル残差ゲインの候補を格納し、これらは探索部(306)からの指示によりその候補の中から順次、スペクトル残差形状ベクトル、スペクトル残差ゲインを出力する。乗算器(308)は、スペクトル残差形状ベクトルの候補とスペクトル残差ゲインの候補を乗じ、フィルタリング部(303)に出力する。フィルタリング部(303)は、フィルタ状態設定部(302)で設定されたピッチフィルタの内部状態、ラグ設定部(304)から出力されるラグT、およびゲイン調整されたスペクトル残差形状ベクトルを用いてフィルタリングを行う。

Description

本発明は、音声信号、オーディオ信号等を符号化/復号化する符号化装置、復号化装置、符号化方法及び復号化方法に関する。
移動体通信システムにおける電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、ユーザからは通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。
このような相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤ部と、入力信号と第1レイヤ復号信号との残差信号を音声以外の信号にも適したモデルで符号化する第2レイヤ部を階層的に組み合わせる構成を採る。このような階層構造を持つ符号化方式は、符号化部より得られるビットストリームにスケーラビリティ性(ビットストリームの一部の情報からでも復号信号が得られること)を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化はその性質から、ビットレートの異なるネットワーク間の通信にも柔軟に対応できる。この特徴は、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものといえる。
従来のスケーラブル符号化としては、例えば非特許文献1記載のものがある。この文献では、MPEG−4(Moving Picture Experts Group phase−4)で規格化された技術を用いてスケーラブル符号化を構成する方法について述べられている。具体的には、第1レイヤ部(基本レイヤ部)では、CELP(Code Excited Linear Prediction:符号励振線形予測)を用いて音声信号つまり原信号を符号化し、第2レイヤ部(拡張レイヤ部)では、例えばAAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization:周波数領域重み付きインターリーブベクトル量子化)のような変換符号化を用いて残差信号を符号化する。ここで、残差信号は、第1レイヤ部で得られた符号化コードを復号したもの(第1レイヤ復号信号)を原信号から減算することにより得られる信号である。
三木弼一編著、「MPEG−4の全て」、初版、(株)工業調査会、1998年9月30日、p.126−127
しかしながら、上記従来技術においては、第2レイヤ部での変換符号化は、原信号から第1レイヤ復号信号を減じて得られる残差信号に対して行われる。よって、原信号に含まれる主要な情報の一部が、第1レイヤ部を介することにより取り除かれることがある。この場合、残差信号の特性が、雑音系列に近い特性となる。したがって、例えばAACやTwinVQのように楽音信号を効率的に符号化するよう設計された変換符号化を、第2レイヤ部に用いる場合、上記特性を持つ残差信号を符号化して復号信号の高品質化を図るには、多くのビットを配分する必要がある。その結果、ビットレートが大きくなってしまうという問題があった。
本発明の目的は、かかる点に鑑みてなされたものであり、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる符号化装置、復号化装置、符号化方法及び復号化方法を提供することである。
本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。
本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。
本発明の復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。
本発明の符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
本発明の復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。
本発明によれば、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる。
本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域符号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域符号化部のフィルタリング部で処理される生成スペクトルバッファを示す模式図 本発明の実施の形態1に係る符号化装置の多重化部から出力されるビットストリームの内容を示す模式図 本発明の実施の形態1に係る復号化装置の構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域復号化部の構成を示すブロック図 本発明の実施の形態2に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態2に係る第1スペクトル符号化部の構成を示すブロック図 本発明の実施の形態2に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態2に係る第1スペクトル復号化部の構成を示すブロック図 本発明の実施の形態2に係る拡張帯域符号化部の構成を示すブロック図 本発明の実施の形態2に係る拡張帯域復号化部の構成を示すブロック図 本発明の実施の形態3に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル符号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル符号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル復号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ符号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ復号化部の構成の変形例を示すブロック図
本発明は、スケーラブル符号化の上位レイヤに適した変換符号化に関し、より具体的には、当該変換符号化におけるスペクトルの効率的な符号化法に関する。
その主な特徴の1つは、第1レイヤ復号信号を周波数分析して得られるスペクトル(第1レイヤ復号スペクトル)を内部状態(フィルタ状態)として持つフィルタを用いてフィルタリング処理を行い、その出力信号を原スペクトルの高域部の推定値とする。ここで、原スペクトルとは、遅延調整された原信号を周波数分析して得られるスペクトルのことである。そして、原スペクトルの高域部に最も類似する出力信号を生成するときのフィルタ情報を符号化して復号化部へ伝送する。フィルタ情報のみを符号化すれば良いため、低ビットレート化が図れる。
本発明のある実施の形態では、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を用いて、前述のフィルタにスペクトル残差を与えてフィルタリング処理を行う。また、他の実施の形態では、第1レイヤ復号スペクトルをフィルタの内部状態に格納する前に第1レイヤ復号スペクトルの誤差成分を符号化して、第1レイヤ復号スペクトルの品質を向上させてから、フィルタリング処理による原スペクトルの高域部の推定を行う。また、さらに他の実施の形態では、第1レイヤ復号スペクトルの誤差成分を符号化する際に、第1レイヤ復号スペクトルの符号化の性能と第1レイヤ復号スペクトルを使った高域スペクトルの推定の性能とがいずれも高くなるように第1レイヤ復号スペクトルの誤差成分の符号化を行う。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、各実施の形態では、複数のレイヤからなる階層構造を有するスケーラブル符号化を行う。また、各実施の形態では、一例として、(1)スケーラブル符号化の階層構造は、第1レイヤ(基本レイヤまたは下位レイヤ)と第1レイヤより上位にある第2レイヤ(拡張レイヤまたは上位レイヤ)の2階層とする、(2)第2レイヤの符号化では、周波数領域で符号化(変換符号化)を行う、(3)第2レイヤの符号化における変換方式にはMDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を使用する、(4)第2レイヤの符号化では、全帯域を複数のサブバンドに分割する場合は、全帯域をBarkスケールで等間隔に分割し各サブバンドを各臨界帯域に対応付ける、(5)第1レイヤの入力信号のサンプリングレート(F1)と第2レイヤの入力信号のサンプリングレート(F2)には、F2はF1以上(F1≦F2)の関係がある、ものとする。
(実施の形態1)
図1は、例えば音声符号化装置等を形成する符号化装置100の構成を示すブロック図である。符号化装置100は、ダウンサンプリング部101、第1レイヤ符号化部102、第1レイヤ復号化部103、多重化部104、第2レイヤ符号化部105および遅延部106を有する。
図1において、サンプリングレートがF2の音声信号やオーディオ信号(原信号)はダウンサンプリング部101に与えられ、ダウンサンプリング部101にてサンプリング変換処理が行われ、サンプリングレートがF1の信号が生成され、第1レイヤ符号化部102に与えられる。第1レイヤ符号化部102は、サンプリングレートがF1の信号を符号化して得られる符号化コードを第1レイヤ復号化部103および多重化部104に出力する。
第1レイヤ復号化部103は、第1レイヤ符号化部102から出力された符号化コードから第1レイヤ復号信号を生成して第2レイヤ符号化部105に出力する。
遅延部106は、原信号に対して所定の長さの遅延を与えて第2レイヤ符号化部105に出力する。この遅延は、ダウンサンプリング部101、第1レイヤ符号化部102および第1レイヤ復号化部103で生じる時間遅れを調整するためのものである。
第2レイヤ符号化部105は、遅延部106から出力された原信号を、第1レイヤ復号化部103から出力された第1レイヤ復号信号を用いて符号化を行う。そして、この符号化により得られる符号化コードを多重化部104に出力する。
多重化部104は、第1レイヤ符号化部102から出力された符号化コードと第2レイヤ符号化部105から出力された符号化コードとを多重化し、ビットストリームとして出力する。
次いで、第2レイヤ符号化部105についてより詳細に説明する。第2レイヤ符号化部105の構成を図2に示す。第2レイヤ符号化部105は、周波数領域変換部201、拡張帯域符号化部202、周波数領域変換部203および聴覚マスキング算出部204を有する。
図2において、周波数領域変換部201は、第1レイヤ復号化部103から出力された第1レイヤ復号信号をMDCT変換により周波数分析してMDCT係数(第1レイヤ復号スペクトル)を算出する。そして、第1レイヤ復号スペクトルを拡張帯域符号化部202に出力する。
周波数領域変換部203は、遅延部106から出力された原信号をMDCT変換により周波数分析してMDCT係数(原スペクトル)を算出する。そして、原スペクトルを拡張帯域符号化部202に出力する。
聴覚マスキング算出部204は、遅延部106から出力された原信号を用いて、帯域毎の聴覚マスキングを算出し、この聴覚マスキングを拡張帯域符号化部202に通知する。
ここで、人間の聴覚特性には、ある信号が聞こえているときにその信号と周波数の近い音が耳に入ってきてもその音が聞こえにくい、という聴覚マスキング特性がある。上記聴覚マスキングは効率的なスペクトル符号化を実現するために用いられる。このスペクトル符号化では、人間の聴覚マスキング特性を利用して聴感上許容される量子化歪を定量化し、その許容される量子化歪に応じた符号化法を適用する。
拡張帯域符号化部202は、図3に示すように、振幅調整部301、フィルタ状態設定部302、フィルタリング部303、ラグ設定部304、スペクトル残差形状符号帳305、探索部306、スペクトル残差ゲイン符号帳307、乗算器308、拡張スペクトル復号化部309およびスケールファクタ符号化部310を有する。
振幅調整部301には、周波数領域変換部201から第1レイヤ復号スペクトル{S1(k);0≦k<Nn}、周波数領域変換部203から原スペクトル{S2(k);0≦k<Nw}が与えられる。ここで、第1レイヤ復号スペクトルのスペクトル点数をNn、原スペクトルのスペクトル点数をNwと表し、Nn<Nwの関係がある。
振幅調整部301は、第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の最大振幅スペクトルと最小振幅スペクトルの比(ダイナミックレンジ)が、原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに近づくよう振幅調整を行う。具体的には、次の式(1)に示すように、振幅スペクトルのべき乗をとる。
Figure 2006049204
ここで、sign()は正号/負号を返す関数、γは0≦γ≦1の範囲にある実数を表す。振幅調整部301は、振幅調整後の第1レイヤ復号スペクトルのダイナミックレンジが原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに最も近づくときのγ(振幅調整係数)を、あらかじめ用意された複数の候補の中から選択し、その符号化コードを多重化部104に出力する。
フィルタ状態設定部302は、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を後述するピッチフィルタの内部状態に設定する。具体的には、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファ{S(k);0≦k<Nn}に代入し、フィルタリング部303へ出力する。ここで、生成スペクトルバッファS(k)は、0≦k<Nwの範囲で定義される配列変数である。後述するフィルタリング処理によって(Nw−Nn)点の原スペクトルの推定値(以下「推定原スペクトル」と言う)の候補が生成される。
ラグ設定部304は、探索部306からの指示に従い、ラグTを予め定められた探索範囲TMIN〜TMAXの中で漸次的に少しずつ変化させながら、フィルタリング部303に順次出力する。
スペクトル残差形状符号帳305は、複数のスペクトル残差形状ベクトルの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差形状ベクトルを順次出力する。
同様に、スペクトル残差ゲイン符号帳307は複数のスペクトル残差ゲインの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差ゲインを順次出力する。
乗算器308は、スペクトル残差形状符号帳305から出力されるスペクトル残差形状ベクトルと、スペクトル残差ゲイン符号帳307から出力されるスペクトル残差ゲインと、を乗じて、スペクトル残差形状ベクトルをゲイン調整する。そして、ゲイン調整されたスペクトル残差形状ベクトルをフィルタリング部303に出力する。
フィルタリング部303は、フィルタ状態設定部302で設定されたピッチフィルタの内部状態と、ラグ設定部304から出力されるラグTと、ゲイン調整されたスペクトル残差形状ベクトルとを用いてフィルタリング処理を行い、推定原スペクトルを算出する。ここで、ピッチフィルタの伝達関数は、次の式(2)で表される。また、このフィルタリング処理は、次の式(3)のように表される。
Figure 2006049204
Figure 2006049204
ここで、C(i,k)は第i番目のスペクトル残差形状ベクトル、g(j)は第j番目のスペクトル残差形状ゲインを表す。範囲Nn≦k<Nwに含まれる生成スペクトルバッファS(k)がフィルタリング部303の出力信号(つまり、推定原スペクトル)として探索部306に出力される。図4に、生成スペクトルバッファ、振幅調整後の第1レイヤ復号スペクトル、フィルタリング部303の出力信号の相互関係を示す。
探索部306は、ラグ設定部304、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307に、ラグ、スペクトル残差形状およびスペクトル残差ゲインの出力をそれぞれ指示する。
また、探索部306は、原スペクトルの高域部{S2(k);Nn≦k<Nw}とフィルタリング部303の出力信号{S(k);Nn≦k<Nw}との間の歪Eを算出する。そして、合成による分析手法(AbS;Analysis by Synthesis)により、最も歪が小さくなるときのラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインの組み合わせを決定する。このとき、聴覚マスキング算出部204から出力された聴覚マスキングを利用して、聴感的に最も歪の小さい組み合わせを選択する。この歪をEとすると、歪Eは、例えば聴覚マスキングにより定まる重み関数w(k)を用いて式(4)によって表される。ここで、重み関数w(k)は、聴覚マスキングの大きい(歪が聞こえ難い)周波数では小さな値をとり、聴覚マスキングの小さい(歪が聞こえ易い)周波数では大きな値をとる。
Figure 2006049204
探索部306により決定されたラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードは、多重化部104および拡張スペクトル復号化部309に出力される。
上記のAbSによる符号化コード決定法においては、ラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを同時に決定しても良いし、あるいは、演算量を削減するために各パラメータを順次(例えば、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲインの順に)決定しても良い。
拡張スペクトル復号化部309は、振幅調整部301より出力される振幅調整係数の符号化コードならびに探索部306より出力されるラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードを復号し、原スペクトルの推定値(推定原スペクトル)を生成する。
具体的には、まず、復号された振幅調整係数γを用いて前述の式(1)に従い第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の振幅調整を行う。次に、振幅調整された第1レイヤ復号スペクトルをフィルタの内部状態として用いるとともに、それぞれ復号されたラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを用いて、前述の式(3)に従ってフィルタリング処理を行い、推定原スペクトル{S(k);Nn≦k<Nw}を生成する。生成された推定原スペクトルはスケールファクタ符号化部310に出力される。
スケールファクタ符号化部310は、周波数領域変換部203より出力される原スペクトルの高域部{S2(k);Nn≦k<Nw}と拡張スペクトル復号化部309より出力される推定原スペクトル{S(k);Nn≦k<Nw}とを用いて、聴覚マスキングを利用して聴感上最も適した推定原スペクトルのスケールファクタ(スケーリング係数)を符号化し、その符号化コードを多重化部104に出力する。
すなわち、第2レイヤ符号化コードは、振幅調整部301から出力される符号化コード(振幅調整係数)、探索部306から出力される符号化コード(ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン)およびスケールファクタ符号化部310から出力される符号化コード(スケールファクタ)の組み合わせからなる。
なお、本実施の形態では、帯域Nn〜Nwに対して拡張帯域符号化部202を適用して一組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定する構成について説明しているが、帯域Nn〜Nwを複数の帯域に分割し各帯域に対して拡張帯域符号化部202を適用する構成にしても良い。この場合、帯域毎に符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定し、多重化部104に出力することになる。例えば、帯域Nn〜NwをM個の帯域に分割して各帯域で拡張帯域符号化部202を適用すると、M組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)が得られることになる。
また、複数帯域でそれぞれ独立の符号化コードを送らずに、隣接する帯域同士で一部の符号化コードを共有しても良い。例えば、帯域Nn〜NwをM個の帯域に分割し、隣接する2つの帯域で共通の振幅調整係数を用いる場合、振幅調整係数の符号化コードの数はM/2個となり、それ以外の符号化コードの数はそれぞれM個となる。
なお、本実施の形態は1次のAR型ピッチフィルタを用いた場合について説明してきた。しかしながら、本発明が適用できるフィルタは1次のAR型ピッチフィルタに限定されず、伝達関数が次の式(5)で表されるフィルタにも本発明を適用することができる。フィルタ次数を規定するパラメータLおよびMの大きいピッチフィルタを用いるほど多様な特性を表現でき、品質が向上する可能性がある。ただし、次数が大きくなるほどフィルタ係数の符号化ビットを多く配分する必要が出てくるため、実用的なビット配分の元で適切なピッチフィルタの伝達関数を決めておく必要がある。
Figure 2006049204
なお、本実施の形態では聴覚マスキングを用いることを前提としているが、聴覚マスキングを用いない構成であっても良い。その場合、図2の聴覚マスキング算出部204を第2レイヤ符号化部105に設ける必要が無くなり、装置全体の演算量を削減できる。
ここで、多重化部104から出力されるビットストリームの構成について、図5を用いて説明する。ビットストリームのMSB(Most Significant Bit)から順に、第1レイヤ符号化コード、第2レイヤ符号化コードが格納されている。さらに、第2レイヤ符号化コードは、スケールファクタ、振幅調整係数、ラグ、スペクトル残差ゲイン、スペクトル残差形状ベクトルの順に格納され、後者の情報ほどLSB(Least Significant Bit)に近い位置に配置されている。このビットストリームの構成は、各符号化コードの符号欠落に対する感度(符号化コードが欠落したときにどの程度復号信号の品質を劣化させるか)に対して、符号誤り感度の高い(大きく劣化する)ものほどMSBに近い位置に配置されている。この構成によれば、伝送路上でビットストリームを部分的に破棄する場合にLSBから順に破棄することで、破棄による劣化を最小限に抑えることができる。LSB側から優先的にビットストリームを破棄するネットワーク構成の一例では、図5のように区切られた各符号化コードを別々のパケットで伝送し、各パケットに優先順位付けをして、優先制御のできるパケット網を使う構成が挙げられる。ただし、ネットワーク構成は前述のものに限定されない。
また、図5のように符号誤り感度の高い符号化パラメータほどMSBに近い位置に配置されるビットストリーム構成において、MSBに近いビットほど強い誤り検出・誤り訂正がかけられるようなチャネル符号化を適用すれば、復号品質の劣化を最小限に抑えられるという効果が得られる。例えば、誤り検出、誤り訂正の手法としてはCRC符号やRS符号などが適用できる。
図6は、例えば音声復号化装置等を形成する復号化装置600の構成を示すブロック図である。
復号化装置600は、符号化装置100から出力されたビットストリームを第1レイヤ符号化コードと第2レイヤ符号化コードとに分離する分離部601、第1レイヤ符号化コードを復号する第1レイヤ復号化部602および第2レイヤ符号化コードを復号する第2レイヤ復号化部603を有する。
分離部601は、符号化装置100から送出されたビットストリームを受信し、第1レイヤの符号化コードと第2レイヤの符号化コードとに分離し、第1レイヤ復号化部602と第2レイヤ復号化部603にそれぞれ出力する。
第1レイヤ復号化部602は、第1レイヤ符号化コードから第1レイヤ復号信号を生成して、第2レイヤ復号化部603に出力する。また、生成された第1レイヤ復号信号を、必要に応じて、最低限の品質が担保された復号信号(第1レイヤ復号信号)として出力する。
第2レイヤ復号化部603は、第1レイヤ復号信号と第2レイヤ符号化コードとを用いて、高品質の復号信号(ここでは、第2レイヤ復号信号と称す)を生成し、必要に応じてこの復号信号を出力する。
このように、第1レイヤ復号信号によって再生音声の最低限の品質が担保され、第2レイヤ復号信号によって再生音声の品質を高めることができる。また、出力する信号を第1レイヤ復号信号または第2レイヤ復号信号のどちらにするかは、ネットワーク環境(パケットロスの発生等)によって第2レイヤ符号化コードが得られるかどうか、または、アプリケーションやユーザの設定等に依存する。
第2レイヤ復号化部603の構成を、図7を用いて詳細に行う。図7において、第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、そのパラメータをスペクトル点数がNnの第1レイヤ復号スペクトルとして拡張帯域復号化部701に出力する。
拡張帯域復号化部701は、分離部601から入力された第2レイヤ符号化コード(この構成では拡張帯域符号化コードと同一)から各種パラメータ(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を復号する。また、復号された各種パラメータと周波数領域変換部702から出力された第1レイヤ復号スペクトルとを用いて帯域拡張された第2の復号スペクトルであってスペクトル点数がNwの第2のスペクトルを生成する。そして、第2の復号スペクトルを時間領域変換部703に出力する。
時間領域変換部703は、第2の復号スペクトルを時間領域の信号に変換した後、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行って、フレーム間に生じる不連続を回避し、第2レイヤ復号信号を出力する。
次に、拡張帯域復号化部701の詳細な説明を、図8を用いて行う。図8において、拡張帯域復号化部701は、分離部801、振幅調整部802、フィルタ状態設定部803、フィルタリング部804、スペクトル残差形状符号帳805、スペクトル残差ゲイン符号帳806、乗算器807、スケールファクタ復号化部808、スケーリング部809およびスペクトル合成部810を有する。
分離部801は、分離部601から入力される拡張帯域符号化コードを振幅調整係数符号化コード、ラグ符号化コード、残差形状符号化コード、残差ゲイン符号化コード、スケールファクタ符号化コード、に分離する。また、振幅調整係数符号化コードを振幅調整部802に、ラグ符号化コードをフィルタリング部804に、残差形状符号化コードをスペクトル残差形状符号帳805に、残差ゲイン符号化コードをスペクトル残差ゲイン符号帳806に、スケールファクタ符号化コードをスケールファクタ復号化部808に、それぞれ出力する。
振幅調整部802は、分離部801から入力された振幅調整係数符号化コードを復号し、復号された振幅調整係数を用いて、別途周波数領域変換部702から入力された第1レイヤ復号スペクトルの振幅を調整し、振幅調整後の第1レイヤ復号スペクトルをフィルタ状態設定部803に出力する。振幅調整は、前述の式(1)で表される方法で行う。ここで、S1(k)は第1レイヤ復号スペクトル、S1’(k)は振幅調整後の第1レイヤ復号スペクトルを表す。
フィルタ状態設定部803は、前述の式(2)で表される伝達関数のピッチフィルタのフィルタ状態に振幅調整後の第1レイヤ復号スペクトルを設定する。具体的には振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファS(k)に代入し、フィルタリング部804へ出力する。ここで、Tはピッチフィルタのラグである。また、生成スペクトルバッファS(k)は、k=0〜Nw−1の範囲で定義される配列変数であり、本フィルタリング処理によって(Nw−Nn)点のスペクトルが生成される。
フィルタリング部804は、分離部801から入力されたラグTを復号し、復号されたラグTを用いて、フィルタ状態設定部803から入力された生成スペクトルバッファS(k)に対してフィルタリング処理を行う。具体的には、前述の式(3)に示される方法によって出力スペクトル{S(k);Nn≦k<Nw}を生成する。ここで、g(j)は残差ゲイン符号化コードjにより表されるスペクトル残差ゲイン、C(i,k)は残差形状符号化コードiにより表されるスペクトル残差形状ベクトルをそれぞれ示しており、g(j)・C(i,k)は乗算器807から入力される。生成されたフィルタリング部804の出力スペクトル{S(k);Nn≦k<Nw}はスケーリング部809へ出力される。
スペクトル残差形状符号帳805は、分離部801から入力された残差形状符号化コードを復号し、復号結果に対応するスペクトル残差形状ベクトルC(i,k)を乗算器807へ出力する。
スペクトル残差ゲイン符号帳806は、分離部801から入力された残差ゲイン符号化コードを復号し、復号結果に対応するスペクトル残差ゲインg(j)を乗算器807へ出力する。
乗算器807は、スペクトル残差形状符号帳805から入力されたスペクトル残差形状ベクトルC(i,k)と、スペクトル残差ゲイン符号帳806から入力されたスペクトル残差ゲインg(j)と、の乗算結果をフィルタリング部804へ出力する。
スケールファクタ復号化部808は、分離部801から入力されたスケールファクタ符号化コードを復号し、復号されたスケールファクタをスケーリング部809へ出力する。
スケーリング部809は、フィルタリング部804から与えられた出力スペクトル{S(k);Nn≦k<Nw}に、スケールファクタ復号化部808から入力されたスケールファクタを乗じて、その乗算結果をスペクトル合成部810に出力する。
スペクトル合成部810は、周波数領域変換部702より与えられる第1レイヤ復号スペクトル{S1(k);0≦k<Nn}と、スケーリング部809から出力されるスケーリング後の生成スペクトルバッファの高域部{S(k);Nn≦k<Nw}を結合して得られるスペクトルを第2の復号スペクトルとして時間領域変換部703に出力する。
(実施の形態2)
図9に、本発明の実施の形態2に係る第2レイヤ符号化部105の構成を示す。図9において図2と同一名称を持つブロックは、同様の機能を有するので、ここではその詳細な説明を省略する。図2と図9の違いは、周波数領域変換部201と拡張帯域符号化部202との間に第1スペクトル符号化部901が存在する点にある。第1スペクトル符号化部901は、周波数領域変換部201より出力される第1レイヤ復号スペクトルの品質を向上させ、そのときの符号化コード(第1のスペクトル符号化コード)を多重化部104に出力するとともに、品質向上された第1レイヤ復号スペクトル(第1の復号スペクトル)を拡張帯域符号化部202に与える。拡張帯域符号化部202は、前述の処理を第1の復号スペクトルを用いて行い、その結果として拡張帯域符号化コードを出力する。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コードと第1のスペクトル符号化コードとの組み合わせからなる。したがって、本実施の形態では、多重化部104は、第1レイヤ符号化コード、拡張帯域符号化コードおよび第1のスペクトル符号化コードを多重化して、ビットストリームを生成する。
次に、第1スペクトル符号化部901の詳細を、図10を用いて説明する。第1スペクトル符号化部901は、スケーリング係数符号化部1001、スケーリング係数復号化部1002、微細スペクトル符号化部1003、多重化部1004、微細スペクトル復号化部1005、正規化部1006、減算器1007および加算器1008を有する。
減算器1007は、原スペクトルから第1レイヤ復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1001および正規化部1006に出力する。スケーリング係数符号化部1001は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、その符号化コードを多重化部1004およびスケーリング係数復号化部1002に出力する。
スケーリング係数の符号化においては、聴覚マスキングを用いても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。これにより、スケーリング係数の符号化を効率化することができる。
スケーリング係数復号化部1002は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1006、微細スペクトル符号化部1003および微細スペクトル復号化部1005に出力する。
正規化部1006は、スケーリング係数復号化部1002より与えられるスケーリング係数を用いて、減算器1007より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1003に出力する。
微細スペクトル符号化部1003は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられるビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル)の符号化を行う。そして、この符号化によって得られた微細スペクトル符号化コードを多重化部1004および微細スペクトル復号化部1005に出力する。
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル符号化部1003へ入力するように構成する。
スケーリング係数符号化部1001および微細スペクトル符号化部1003より出力される符号化コードは、多重化部1004にて多重化され、第1のスペクトル符号化コードとして多重化部104に出力される。
微細スペクトル復号化部1005は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられたビット数を求め、スケーリング係数と微細スペクトル符号化部1003から入力された微細スペクトル符号化コードとから各帯域の残差スペクトルを復号し、復号された残差スペクトルを加算器1008へ出力する。なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1005へ入力するように構成する。
加算器1008は、復号された残差スペクトルと第1レイヤ復号スペクトルとを加算して第1の復号スペクトルを生成し、生成された第1の復号スペクトルを拡張帯域符号化部202へ出力する。
このように本実施の形態によれば、第1レイヤ復号スペクトルの品質を改善した後に、品質改善後のスペクトル、つまり第1のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成することにより、帯域拡張された復号信号の品質を改善することができる。
本実施の形態の第2レイヤ復号化部603の構成を、図11を用いて詳細に行う。図11において図7と同一名称のブロックは、同一の機能を有するため、ここではその詳細な説明を省略する。図11において、第2レイヤ復号化部603は、分離部1101、第1スペクトル復号化部1102、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
分離部1101は、第2レイヤ符号化コードを、第1のスペクトル符号化コード、拡張帯域符号化コード、に分離し、第1のスペクトル符号化コードを第1スペクトル復号化部1102に、拡張帯域符号化コードを拡張帯域復号化部701に、それぞれ出力する。
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、このパラメータを第1レイヤ復号スペクトルとして第1スペクトル復号化部1102に出力する。
第1スペクトル復号化部1102は、分離部1101から入力された第1のスペクトル符号化コードを復号して得られる第1レイヤの符号化誤差の量子化スペクトルを、周波数領域変換部702から入力された第1レイヤ復号スペクトルに加える。そして、その加算結果を第1の復号スペクトルとして拡張帯域復号化部701へ出力する。
ここで、第1スペクトル復号化部1102の説明を、図12を用いて詳細に行う。第1スペクトル復号化部1102は、分離部1201、スケーリング係数復号化部1202、微細スペクトル復号化部1203およびスペクトル復号部1204を有する。
分離部1201は、入力された第1のスペクトル符号化コードから、スケーリング係数を表す符号化コードと、微細スペクトル(スペクトル微細構造)を表す符号化コードと、を分離し、スケーリング係数符号化コードをスケーリング係数復号化部1202に、微細スペクトル符号化コードを微細スペクトル復号化部1203に、それぞれ出力する。
スケーリング係数復号化部1202は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数をスペクトル復号部1204および微細スペクトル復号化部1203に出力する。
微細スペクトル復号化部1203は、スケーリング係数復号化部1202から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域の微細スペクトルに割り当てられたビット数を求める。また、分離部1201から入力された微細スペクトル符号化コードから各帯域の微細スペクトルを復号し、復号された微細スペクトルをスペクトル復号部1204へ出力する。
なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1203へ入力するように構成する。
スペクトル復号部1204は、周波数領域変換部702から与えられた第1レイヤ復号スペクトルと、スケーリング係数復号化部1202から入力されたスケーリング係数と、微細スペクトル復号化部1203から入力された微細スペクトルと、から第1の復号スペクトルを復号し、この復号スペクトルを拡張帯域復号化部701へ出力する。
なお、本実施の形態の拡張帯域符号化部202には、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307を設けなくとも良い。この場合の拡張帯域符号化部202の構成は、図13に示される。また、拡張帯域復号化部701には、スペクトル残差形状符号帳805およびスペクトル残差ゲイン符号帳806を設けなくとも良い。この場合の拡張帯域復号化部701の構成は、図14に示される。なお、図13および図14にそれぞれ示されるフィルタリング部1301、1401の出力信号は、次の式(6)で表される。
Figure 2006049204
本実施の形態では、第1レイヤ復号スペクトルの品質を改善した後に、この品質改善後のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成する。この構成によれば、復号信号の品質を改善することができる。この利点は、スペクトル残差形状符号帳およびスペクトル残差ゲイン符号帳の有無に関わらず享受できる。
なお、第1スペクトル符号化部901では、低域部(0≦k<Nn)のスペクトルの符号化を行う際に、全帯域(0≦k<Nw)の符号化歪が最も小さくなるように低域部(0≦k<Nn)のスペクトルの符号化を行っても良い。この場合、拡張帯域符号化部202では、高域部(Nn≦k<Nw)の符号化まで行われる。また、この場合、第1スペクトル符号化部901において、低域部の符号化結果が高域部の符号化に与える影響も考慮して低域部の符号化を行うことになる。したがって、全帯域のスペクトルが最適になるよう低域部のスペクトルの符号化が為されるようになるため、品質が向上するという効果が得られる。
(実施の形態3)
本発明の実施の形態3に係る第2レイヤ符号化部105の構成を図15に示す。図15において図9と同一名称のブロックは同一の機能を有するため、ここではその詳細な説明を省略する。
図9との違いは、復号機能を有し且つ拡張帯域符号化コードを求める拡張帯域符号化部1501と、その拡張帯域符号化コードを用いて第2の復号スペクトルを生成し原スペクトルから第2の復号スペクトルを減じて求められる誤差スペクトルを符号化する第2スペクトル符号化部1502と、が設けられた点にある。前述の誤差スペクトルを第2スペクトル符号化部1502にて符号化することでより高品質な復号スペクトルを生成できるようになり、復号化装置で得られる復号信号の品質を向上させることができる。
拡張帯域符号化部1501は、図3に示された拡張帯域符号化部202と同様に拡張帯域符号化コードを生成して出力する。また、拡張帯域符号化部1501は、図8に示される拡張帯域復号化部701と同様の構成を内包し、拡張帯域復号化部701と同様に第2の復号スペクトルを生成する。この第2の復号スペクトルは、第2スペクトル符号化部1502に出力される。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コード、第1のスペクトル符号化コードおよび第2のスペクトル符号化コードからなる。
なお、拡張帯域符号化部1501の構成において、図3および図8で共通の名称を持つブロックは共有化されていても良い。
第2スペクトル符号化部1502は、図16に示すように、スケーリング係数符号化部1601、スケーリング係数復号化部1602、微細スペクトル符号化部1603、多重化部1604、正規化部1605および減算器1606を有する。
減算器1606は、原スペクトルから第2の復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1601および正規化部1605に出力する。スケーリング係数符号化部1601は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、スケーリング係数符号化コードを多重化部1604およびスケーリング係数復号化部1602に出力する。
ここで、聴覚マスキングを用いてスケーリング係数の符号化の効率化を図っても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。
スケーリング係数復号化部1602は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1605および微細スペクトル符号化部1603に出力する。
正規化部1605は、スケーリング係数復号化部1602より与えられるスケーリング係数を用いて、減算器1606より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1603に出力する。
微細スペクトル符号化部1603は、スケーリング係数復号化部1602から入力された復号スケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられたビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル)の符号化を行う。そして、この符号化によって得られた符号化コードを多重化部1604に出力する。
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第2レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第2レイヤ復号スペクトルを微細スペクトル符号化部1603へ入力するように構成する。
スケーリング係数符号化部1601および微細スペクトル符号化部1603より出力される符号化コードは多重化部1604にて多重化され、第2のスペクトル符号化コードとして出力される。
図17は、第2スペクトル符号化部1502の構成の変形例を示している。図17において図16と同一名称のブロックは同一機能を有するため、ここではその詳細な説明を省略する。
この構成では、第2スペクトル符号化部1502は、減算器1606より与えられる残差スペクトルを直接符号化する。つまり、残差スペクトルの正規化は行われない。そのため本構成では、図16に示されたスケーリング係数符号化部1601、スケーリング係数復号化部1602および正規化部1605が設けられていない。この構成によれば、第2スペクトル符号化部1502でスケーリング係数にビットを配分する必要が無くなるため、ビットレートを低減させることができる。
聴覚重要度およびビット配分算出部1701は、第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度およびビット配分は、微細スペクトル符号化部1603へ出力される。
微細スペクトル符号化部1603は、聴覚重要度およびビット配分算出部1701から入力された聴覚重要度およびビット配分に基づいて、残差スペクトルを符号化する。そして、この符号化によって得られた符号化コードを第2のスペクトル符号化コードとして多重化部104に出力する。なお、残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。
本実施の形態の第2レイヤ復号化部603の構成を図18に示す。第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702、時間領域変換部703、分離部1101、第1スペクトル復号化部1102および第2スペクトル復号化部1801を有する。図18において図11と同一名称のブロックは同一の機能を有するので、ここではその詳細な説明を省略する。
第2スペクトル復号化部1801は、分離部1101から入力された第2のスペクトル符号化コードを復号して得られる第2の復号スペクトルの符号化誤差を量子化したスペクトルを、拡張帯域復号化部701から入力された第2の復号スペクトルに加える。そして、この加算結果を第3の復号スペクトルとして時間領域変換部703へ出力する。
第2スペクトル復号化部1801は、第2スペクトル符号化部1502が図16に示す構成を採る場合、図12と同様の構成を採る。ただし、図12における第1のスペクトル符号化コード、第1レイヤ復号スペクトルおよび第1の復号スペクトルは、それぞれ、第2のスペクトル符号化コード、第2の復号スペクトルおよび第3の復号スペクトルに置き換わる。
また、本実施の形態では、第2スペクトル復号化部1801の構成について、第2スペクトル符号化部1502が図16に示す構成を採る場合を例に挙げて説明したが、第2スペクトル符号化部1502が図17に示す構成を採る場合、第2スペクトル復号化部1801の構成は、図19のようになる。
つまり図19は、スケーリング係数を用いない第2スペクトル符号化部1502に対応する第2スペクトル復号化部1801の構成を示している。第2スペクトル復号化部1801は、聴覚重要度およびビット配分算出部1901と微細スペクトル復号化部1902とスペクトル復号部1903とを有する。
図19において、聴覚重要度およびビット配分算出部1901は、拡張帯域復号化部701から入力された第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度とビット配分は、微細スペクトル復号化部1902へ出力される。
微細スペクトル復号化部1902は、聴覚重要度およびビット配分算出部1901から入力された聴覚重要度およびビット配分に基づいて、分離部1101から第2のスペクトル符号化コードとして入力される微細スペクトル符号化コードを復号し、その復号結果(各帯域の微細スペクトル)をスペクトル復号部1903に出力する。
微細スペクトル復号化部1903は、拡張帯域復号化部701から入力された第2の復号スペクトルに、微細スペクトル復号化部1902から入力された微細スペクトルを加えて、その加算結果を第3の復号スペクトルとして外部へ出力する。
なお、本実施の形態では、第1スペクトル符号化部901および第1スペクトル復号化部1102を含む構成を例に挙げて説明したが、第1スペクトル符号化部901および第1スペクトル復号化部1102が無くても本実施の形態の作用効果を実現することができる。その場合の第2レイヤ符号化部105の構成を図20に、第2レイヤ復号化部603の構成を図21に、それぞれ示す。
以上、本発明によるスケーラブル復号化装置およびスケーラブル符号化装置の実施の形態について説明した。
なお、上記実施の形態においては、変換方式としてMDCTを使って説明したがこれに限定されず、他の変換方式、例えばフーリエ変換やコサイン変換、Wavelet変換などを使用したときにも本発明は適用できる。
また、上記実施の形態においては、階層数2を基に説明したがこれに限定されず、2以上の階層を持つスケーラブル符号化/復号化にも適用できる。
また、本発明に係る符号化装置および復号化装置は、上記の実施の形態1〜3に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
すなわち、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1パラメータ算出手段は、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを前記第1パラメータとして出力する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第2パラメータ算出手段は、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳を有し、前記スペクトル残差の符号を前記第2パラメータとして出力する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、前記第1パラメータ算出手段および前記第2パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記残差成分符号化手段は、前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。
また、上記実施の形態に係るスケーラブル復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
また、上記実施の形態に係るスケーラブル復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。
特に、本発明による第1のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定し、フィルタ情報を符号化して送るスペクトル符号化装置において、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を有し、前記フィルタの入力信号としてスペクトル残差を与えフィルタリングを行い第2スペクトルの高域部を推定するもので、スペクトル残差を用いることにより、第1スペクトルの変形では表せない第2スペクトルの高域部の成分を符号化することができるようになるため、第2スペクトルの高域部の推定性能が向上し高品質化が為される。
また、本発明による第2のスケーラブル符号化装置は、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化して第1スペクトルの高品質化を図った後に、この第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定するもので、第2スペクトルの低域部に対する第1スペクトルの品質を改善させた後に、品質改善後の第1スペクトルを用いて第2スペクトルの高域部を推定することにより、推定性能が向上し高品質化が為される。
また、本発明による第3のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定して生成される推定スペクトルと第2スペクトルの高域部の間の誤差成分と、第2スペクトルの低域部と第1スペクトルの間の誤差成分の両誤差成分を小さくするように、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化するもので、第1スペクトルと第2スペクトルの低域部の間の誤差成分を符号化する際に、第1スペクトルおよび第2スペクトルの高域部の推定スペクトルの両品質が同時に向上する第1スペクトルの符号化が為されるため、高品質化が実現できる。
また、上記第1〜3のスケーラブル符号化装置においては、符号化装置にて復号化装置に伝送されるビットストリームを生成する際に、当該ビットストリームは少なくとも、スケールファクタ、ダイナミックレンジ調整係数、ラグ、を含み、この順番でビットストリームを構成するようにしてもよい。これにより、ビットストリームの構成は復号信号の品質に与える影響が大きいパラメータほどビットストリームのMSB(Most Significant Bit)の近くに配置されているため、ビットストリームのLSB(Least Significant Bit)から任意のビット位置でビットが削除されても品質劣化が生じ難いという効果が得られる。
本明細書は、2004年11月5日出願の特願2004−322959に基づく。この内容はすべてここに含めておく。
本発明に係る符号化装置、復号化装置、符号化方法及び復号化方法は、スケーラブル符号化/復号化等に適用できる。
本発明は、音声信号、オーディオ信号等を符号化/復号化する符号化装置、復号化装置、符号化方法及び復号化方法に関する。
移動体通信システムにおける電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、ユーザからは通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。
このような相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤ部と、入力信号と第1レイヤ復号信号との残差信号を音声以外の信号にも適したモデルで符号化する第2レイヤ部を階層的に組み合わせる構成を採る。このような階層構造を持つ符号化方式は、符号化部より得られるビットストリームにスケーラビリティ性(ビットストリームの一部の情報からでも復号信号が得られること)を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化はその性質から、ビットレートの異なるネットワーク間の通信にも柔軟に対応できる。この特徴は、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものといえる。
従来のスケーラブル符号化としては、例えば非特許文献1記載のものがある。この文献では、MPEG-4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を構成する方法について述べられている。具体的には、第1レイヤ部(基本レイヤ部)では、CELP(Code Excited Linear Prediction:符号励振線形予測)を用いて音声信号つまり原信号を符号化し、第2レイヤ部(拡張レイヤ部)では、例えばAAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization:周波数領域重み付きインターリーブベクトル量子化)のような変換符号化を用いて残差信号を符号化する。ここで、残差信号は、第1レイヤ部で得られた符号化コードを復号したもの(第1レイヤ復号信号)を原信号から減算することにより得られる信号である。
三木弼一編著、「MPEG-4の全て」、初版、(株)工業調査会、1998年9月30日、p.126−127
しかしながら、上記従来技術においては、第2レイヤ部での変換符号化は、原信号から第1レイヤ復号信号を減じて得られる残差信号に対して行われる。よって、原信号に含まれる主要な情報の一部が、第1レイヤ部を介することにより取り除かれることがある。この場合、残差信号の特性が、雑音系列に近い特性となる。したがって、例えばAACやTwinVQのように楽音信号を効率的に符号化するよう設計された変換符号化を、第2レイヤ部に用いる場合、上記特性を持つ残差信号を符号化して復号信号の高品質化を図るには、多くのビットを配分する必要がある。その結果、ビットレートが大きくなってしまうという問題があった。
本発明の目的は、かかる点に鑑みてなされたものであり、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることがで
きる符号化装置、復号化装置、符号化方法及び復号化方法を提供することである。
本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。
本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。
本発明の復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。
本発明の符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
本発明の復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。
本発明によれば、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる。
本発明は、スケーラブル符号化の上位レイヤに適した変換符号化に関し、より具体的には、当該変換符号化におけるスペクトルの効率的な符号化法に関する。
その主な特徴の1つは、第1レイヤ復号信号を周波数分析して得られるスペクトル(第1レイヤ復号スペクトル)を内部状態(フィルタ状態)として持つフィルタを用いてフィルタリング処理を行い、その出力信号を原スペクトルの高域部の推定値とする。ここで、原スペクトルとは、遅延調整された原信号を周波数分析して得られるスペクトルのことである。そして、原スペクトルの高域部に最も類似する出力信号を生成するときのフィルタ情報を符号化して復号化部へ伝送する。フィルタ情報のみを符号化すれば良いため、低ビットレート化が図れる。
本発明のある実施の形態では、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を用いて、前述のフィルタにスペクトル残差を与えてフィルタリング処理を行う。また、他の実施の形態では、第1レイヤ復号スペクトルをフィルタの内部状態に
格納する前に第1レイヤ復号スペクトルの誤差成分を符号化して、第1レイヤ復号スペクトルの品質を向上させてから、フィルタリング処理による原スペクトルの高域部の推定を行う。また、さらに他の実施の形態では、第1レイヤ復号スペクトルの誤差成分を符号化する際に、第1レイヤ復号スペクトルの符号化の性能と第1レイヤ復号スペクトルを使った高域スペクトルの推定の性能とがいずれも高くなるように第1レイヤ復号スペクトルの誤差成分の符号化を行う。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、各実施の形態では、複数のレイヤからなる階層構造を有するスケーラブル符号化を行う。また、各実施の形態では、一例として、(1)スケーラブル符号化の階層構造は、第1レイヤ(基本レイヤまたは下位レイヤ)と第1レイヤより上位にある第2レイヤ(拡張レイヤまたは上位レイヤ)の2階層とする、(2)第2レイヤの符号化では、周波数領域で符号化(変換符号化)を行う、(3)第2レイヤの符号化における変換方式にはMDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を使用する、(4)第2レイヤの符号化では、全帯域を複数のサブバンドに分割する場合は、全帯域をBarkスケールで等間隔に分割し各サブバンドを各臨界帯域に対応付ける、(5)第1レイヤの入力信号のサンプリングレート(F1)と第2レイヤの入力信号のサンプリングレート(F2)には、F2はF1以上(F1≦F2)の関係がある、ものとする。
(実施の形態1)
図1は、例えば音声符号化装置等を形成する符号化装置100の構成を示すブロック図である。符号化装置100は、ダウンサンプリング部101、第1レイヤ符号化部102、第1レイヤ復号化部103、多重化部104、第2レイヤ符号化部105および遅延部106を有する。
図1において、サンプリングレートがF2の音声信号やオーディオ信号(原信号)はダウンサンプリング部101に与えられ、ダウンサンプリング部101にてサンプリング変換処理が行われ、サンプリングレートがF1の信号が生成され、第1レイヤ符号化部102に与えられる。第1レイヤ符号化部102は、サンプリングレートがF1の信号を符号化して得られる符号化コードを第1レイヤ復号化部103および多重化部104に出力する。
第1レイヤ復号化部103は、第1レイヤ符号化部102から出力された符号化コードから第1レイヤ復号信号を生成して第2レイヤ符号化部105に出力する。
遅延部106は、原信号に対して所定の長さの遅延を与えて第2レイヤ符号化部105に出力する。この遅延は、ダウンサンプリング部101、第1レイヤ符号化部102および第1レイヤ復号化部103で生じる時間遅れを調整するためのものである。
第2レイヤ符号化部105は、遅延部106から出力された原信号を、第1レイヤ復号化部103から出力された第1レイヤ復号信号を用いて符号化を行う。そして、この符号化により得られる符号化コードを多重化部104に出力する。
多重化部104は、第1レイヤ符号化部102から出力された符号化コードと第2レイヤ符号化部105から出力された符号化コードとを多重化し、ビットストリームとして出力する。
次いで、第2レイヤ符号化部105についてより詳細に説明する。第2レイヤ符号化部105の構成を図2に示す。第2レイヤ符号化部105は、周波数領域変換部201、拡張帯域符号化部202、周波数領域変換部203および聴覚マスキング算出部204を有
する。
図2において、周波数領域変換部201は、第1レイヤ復号化部103から出力された第1レイヤ復号信号をMDCT変換により周波数分析してMDCT係数(第1レイヤ復号スペクトル)を算出する。そして、第1レイヤ復号スペクトルを拡張帯域符号化部202に出力する。
周波数領域変換部203は、遅延部106から出力された原信号をMDCT変換により周波数分析してMDCT係数(原スペクトル)を算出する。そして、原スペクトルを拡張帯域符号化部202に出力する。
聴覚マスキング算出部204は、遅延部106から出力された原信号を用いて、帯域毎の聴覚マスキングを算出し、この聴覚マスキングを拡張帯域符号化部202に通知する。
ここで、人間の聴覚特性には、ある信号が聞こえているときにその信号と周波数の近い音が耳に入ってきてもその音が聞こえにくい、という聴覚マスキング特性がある。上記聴覚マスキングは効率的なスペクトル符号化を実現するために用いられる。このスペクトル符号化では、人間の聴覚マスキング特性を利用して聴感上許容される量子化歪を定量化し、その許容される量子化歪に応じた符号化法を適用する。
拡張帯域符号化部202は、図3に示すように、振幅調整部301、フィルタ状態設定部302、フィルタリング部303、ラグ設定部304、スペクトル残差形状符号帳305、探索部306、スペクトル残差ゲイン符号帳307、乗算器308、拡張スペクトル復号化部309およびスケールファクタ符号化部310を有する。
振幅調整部301には、周波数領域変換部201から第1レイヤ復号スペクトル{S1(k);0≦k<Nn}、周波数領域変換部203から原スペクトル{S2(k);0≦k<Nw}が与えられる。ここで、第1レイヤ復号スペクトルのスペクトル点数をNn、原スペクトルのスペクトル点数をNwと表し、Nn<Nwの関係がある。
振幅調整部301は、第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の最大振幅スペクトルと最小振幅スペクトルの比(ダイナミックレンジ)が、原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに近づくよう振幅調整を行う。具体的には、次の式(1)に示すように、振幅スペクトルのべき乗をとる。
Figure 2006049204
ここで、sign()は正号/負号を返す関数、γは0≦γ≦1の範囲にある実数を表す。振幅調整部301は、振幅調整後の第1レイヤ復号スペクトルのダイナミックレンジが原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに最も近づくときのγ(振幅調整係数)を、あらかじめ用意された複数の候補の中から選択し、その符号化コードを多重化部104に出力する。
フィルタ状態設定部302は、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を後述するピッチフィルタの内部状態に設定する。具体的には、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファ{S(k);0≦k<Nn}に代入し、フィルタリング部303へ出力する。ここで、生成スペクトルバッファS(k)は、0≦k<Nwの範囲で定義される配列変数である
。後述するフィルタリング処理によって(Nw−Nn)点の原スペクトルの推定値(以下「推定原スペクトル」と言う)の候補が生成される。
ラグ設定部304は、探索部306からの指示に従い、ラグTを予め定められた探索範囲TMIN〜TMAXの中で漸次的に少しずつ変化させながら、フィルタリング部303に順次出力する。
スペクトル残差形状符号帳305は、複数のスペクトル残差形状ベクトルの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差形状ベクトルを順次出力する。
同様に、スペクトル残差ゲイン符号帳307は複数のスペクトル残差ゲインの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差ゲインを順次出力する。
乗算器308は、スペクトル残差形状符号帳305から出力されるスペクトル残差形状ベクトルと、スペクトル残差ゲイン符号帳307から出力されるスペクトル残差ゲインと、を乗じて、スペクトル残差形状ベクトルをゲイン調整する。そして、ゲイン調整されたスペクトル残差形状ベクトルをフィルタリング部303に出力する。
フィルタリング部303は、フィルタ状態設定部302で設定されたピッチフィルタの内部状態と、ラグ設定部304から出力されるラグTと、ゲイン調整されたスペクトル残差形状ベクトルとを用いてフィルタリング処理を行い、推定原スペクトルを算出する。ここで、ピッチフィルタの伝達関数は、次の式(2)で表される。また、このフィルタリング処理は、次の式(3)のように表される。
Figure 2006049204
Figure 2006049204
ここで、C(i,k)は第i番目のスペクトル残差形状ベクトル、g(j)は第j番目のスペクトル残差形状ゲインを表す。範囲Nn≦k<Nwに含まれる生成スペクトルバッファS(k)がフィルタリング部303の出力信号(つまり、推定原スペクトル)として探索部306に出力される。図4に、生成スペクトルバッファ、振幅調整後の第1レイヤ復号スペクトル、フィルタリング部303の出力信号の相互関係を示す。
探索部306は、ラグ設定部304、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307に、ラグ、スペクトル残差形状およびスペクトル残差ゲインの出力をそれぞれ指示する。
また、探索部306は、原スペクトルの高域部{S2(k);Nn≦k<Nw}とフィルタリング部303の出力信号{S(k);Nn≦k<Nw}との間の歪Eを算出する。そして、合成による分析手法(AbS;Analysis by Synthesis)により、最も歪が小さくなるときのラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインの組み合わせを決定する。このとき、聴覚マスキング算出部204から出力された聴覚マスキングを利用して、聴感的に最も歪の小さい組み合わせを選択する。この歪をEとすると、歪Eは、例えば聴覚マスキングにより定まる重み関数w(k)を用いて式
(4)によって表される。ここで、重み関数w(k)は、聴覚マスキングの大きい(歪が聞こえ難い)周波数では小さな値をとり、聴覚マスキングの小さい(歪が聞こえ易い)周波数では大きな値をとる。
Figure 2006049204
探索部306により決定されたラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードは、多重化部104および拡張スペクトル復号化部309に出力される。
上記のAbSによる符号化コード決定法においては、ラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを同時に決定しても良いし、あるいは、演算量を削減するために各パラメータを順次(例えば、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲインの順に)決定しても良い。
拡張スペクトル復号化部309は、振幅調整部301より出力される振幅調整係数の符号化コードならびに探索部306より出力されるラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードを復号し、原スペクトルの推定値(推定原スペクトル)を生成する。
具体的には、まず、復号された振幅調整係数γを用いて前述の式(1)に従い第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の振幅調整を行う。次に、振幅調整された第1レイヤ復号スペクトルをフィルタの内部状態として用いるとともに、それぞれ復号されたラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを用いて、前述の式(3)に従ってフィルタリング処理を行い、推定原スペクトル{S(k);Nn≦k<Nw}を生成する。生成された推定原スペクトルはスケールファクタ符号化部310に出力される。
スケールファクタ符号化部310は、周波数領域変換部203より出力される原スペクトルの高域部{S2(k);Nn≦k<Nw}と拡張スペクトル復号化部309より出力される推定原スペクトル{S(k);Nn≦k<Nw}とを用いて、聴覚マスキングを利用して聴感上最も適した推定原スペクトルのスケールファクタ(スケーリング係数)を符号化し、その符号化コードを多重化部104に出力する。
すなわち、第2レイヤ符号化コードは、振幅調整部301から出力される符号化コード(振幅調整係数)、探索部306から出力される符号化コード(ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン)およびスケールファクタ符号化部310から出力される符号化コード(スケールファクタ)の組み合わせからなる。
なお、本実施の形態では、帯域Nn〜Nwに対して拡張帯域符号化部202を適用して一組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定する構成について説明しているが、帯域Nn〜Nwを複数の帯域に分割し各帯域に対して拡張帯域符号化部202を適用する構成にしても良い。この場合、帯域毎に符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定し、多重化部104に出力することになる。例えば、帯域Nn〜NwをM個の帯域に分割して各帯域で拡張帯域符号化部202を適用すると、M組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベク
トル、スペクトル残差ゲイン、スケールファクタ)が得られることになる。
また、複数帯域でそれぞれ独立の符号化コードを送らずに、隣接する帯域同士で一部の符号化コードを共有しても良い。例えば、帯域Nn〜NwをM個の帯域に分割し、隣接する2つの帯域で共通の振幅調整係数を用いる場合、振幅調整係数の符号化コードの数はM/2個となり、それ以外の符号化コードの数はそれぞれM個となる。
なお、本実施の形態は1次のAR型ピッチフィルタを用いた場合について説明してきた。しかしながら、本発明が適用できるフィルタは1次のAR型ピッチフィルタに限定されず、伝達関数が次の式(5)で表されるフィルタにも本発明を適用することができる。フィルタ次数を規定するパラメータLおよびMの大きいピッチフィルタを用いるほど多様な特性を表現でき、品質が向上する可能性がある。ただし、次数が大きくなるほどフィルタ係数の符号化ビットを多く配分する必要が出てくるため、実用的なビット配分の元で適切なピッチフィルタの伝達関数を決めておく必要がある。
Figure 2006049204
なお、本実施の形態では聴覚マスキングを用いることを前提としているが、聴覚マスキングを用いない構成であっても良い。その場合、図2の聴覚マスキング算出部204を第2レイヤ符号化部105に設ける必要が無くなり、装置全体の演算量を削減できる。
ここで、多重化部104から出力されるビットストリームの構成について、図5を用いて説明する。ビットストリームのMSB(Most Significant Bit)から順に、第1レイヤ符号化コード、第2レイヤ符号化コードが格納されている。さらに、第2レイヤ符号化コードは、スケールファクタ、振幅調整係数、ラグ、スペクトル残差ゲイン、スペクトル残差形状ベクトルの順に格納され、後者の情報ほどLSB(Least Significant Bit)に近い位置に配置されている。このビットストリームの構成は、各符号化コードの符号欠落に対する感度(符号化コードが欠落したときにどの程度復号信号の品質を劣化させるか)に対して、符号誤り感度の高い(大きく劣化する)ものほどMSBに近い位置に配置されている。この構成によれば、伝送路上でビットストリームを部分的に破棄する場合にLSBから順に破棄することで、破棄による劣化を最小限に抑えることができる。LSB側から優先的にビットストリームを破棄するネットワーク構成の一例では、図5のように区切られた各符号化コードを別々のパケットで伝送し、各パケットに優先順位付けをして、優先制御のできるパケット網を使う構成が挙げられる。ただし、ネットワーク構成は前述のものに限定されない。
また、図5のように符号誤り感度の高い符号化パラメータほどMSBに近い位置に配置されるビットストリーム構成において、MSBに近いビットほど強い誤り検出・誤り訂正がかけられるようなチャネル符号化を適用すれば、復号品質の劣化を最小限に抑えられるという効果が得られる。例えば、誤り検出、誤り訂正の手法としてはCRC符号やRS符号などが適用できる。
図6は、例えば音声復号化装置等を形成する復号化装置600の構成を示すブロック図である。
復号化装置600は、符号化装置100から出力されたビットストリームを第1レイヤ符号化コードと第2レイヤ符号化コードとに分離する分離部601、第1レイヤ符号化コードを復号する第1レイヤ復号化部602および第2レイヤ符号化コードを復号する第2レイヤ復号化部603を有する。
分離部601は、符号化装置100から送出されたビットストリームを受信し、第1レイヤの符号化コードと第2レイヤの符号化コードとに分離し、第1レイヤ復号化部602と第2レイヤ復号化部603にそれぞれ出力する。
第1レイヤ復号化部602は、第1レイヤ符号化コードから第1レイヤ復号信号を生成して、第2レイヤ復号化部603に出力する。また、生成された第1レイヤ復号信号を、必要に応じて、最低限の品質が担保された復号信号(第1レイヤ復号信号)として出力する。
第2レイヤ復号化部603は、第1レイヤ復号信号と第2レイヤ符号化コードとを用いて、高品質の復号信号(ここでは、第2レイヤ復号信号と称す)を生成し、必要に応じてこの復号信号を出力する。
このように、第1レイヤ復号信号によって再生音声の最低限の品質が担保され、第2レイヤ復号信号によって再生音声の品質を高めることができる。また、出力する信号を第1レイヤ復号信号または第2レイヤ復号信号のどちらにするかは、ネットワーク環境(パケットロスの発生等)によって第2レイヤ符号化コードが得られるかどうか、または、アプリケーションやユーザの設定等に依存する。
第2レイヤ復号化部603の構成を、図7を用いて詳細に行う。図7において、第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、そのパラメータをスペクトル点数がNnの第1レイヤ復号スペクトルとして拡張帯域復号化部701に出力する。
拡張帯域復号化部701は、分離部601から入力された第2レイヤ符号化コード(この構成では拡張帯域符号化コードと同一)から各種パラメータ(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を復号する。また、復号された各種パラメータと周波数領域変換部702から出力された第1レイヤ復号スペクトルとを用いて帯域拡張された第2の復号スペクトルであってスペクトル点数がNwの第2のスペクトルを生成する。そして、第2の復号スペクトルを時間領域変換部703に出力する。
時間領域変換部703は、第2の復号スペクトルを時間領域の信号に変換した後、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行って、フレーム間に生じる不連続を回避し、第2レイヤ復号信号を出力する。
次に、拡張帯域復号化部701の詳細な説明を、図8を用いて行う。図8において、拡張帯域復号化部701は、分離部801、振幅調整部802、フィルタ状態設定部803、フィルタリング部804、スペクトル残差形状符号帳805、スペクトル残差ゲイン符号帳806、乗算器807、スケールファクタ復号化部808、スケーリング部809およびスペクトル合成部810を有する。
分離部801は、分離部601から入力される拡張帯域符号化コードを振幅調整係数符号化コード、ラグ符号化コード、残差形状符号化コード、残差ゲイン符号化コード、スケールファクタ符号化コード、に分離する。また、振幅調整係数符号化コードを振幅調整部802に、ラグ符号化コードをフィルタリング部804に、残差形状符号化コードをスペクトル残差形状符号帳805に、残差ゲイン符号化コードをスペクトル残差ゲイン符号帳806に、スケールファクタ符号化コードをスケールファクタ復号化部808に、それぞれ出力する。
振幅調整部802は、分離部801から入力された振幅調整係数符号化コードを復号し、復号された振幅調整係数を用いて、別途周波数領域変換部702から入力された第1レイヤ復号スペクトルの振幅を調整し、振幅調整後の第1レイヤ復号スペクトルをフィルタ状態設定部803に出力する。振幅調整は、前述の式(1)で表される方法で行う。ここで、S1(k)は第1レイヤ復号スペクトル、S1’(k)は振幅調整後の第1レイヤ復号スペクトルを表す。
フィルタ状態設定部803は、前述の式(2)で表される伝達関数のピッチフィルタのフィルタ状態に振幅調整後の第1レイヤ復号スペクトルを設定する。具体的には振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファS(k)に代入し、フィルタリング部804へ出力する。ここで、Tはピッチフィルタのラグである。また、生成スペクトルバッファS(k)は、k=0〜Nw−1の範囲で定義される配列変数であり、本フィルタリング処理によって(Nw−Nn)点のスペクトルが生成される。
フィルタリング部804は、分離部801から入力されたラグTを復号し、復号されたラグTを用いて、フィルタ状態設定部803から入力された生成スペクトルバッファS(k)に対してフィルタリング処理を行う。具体的には、前述の式(3)に示される方法によって出力スペクトル{S(k);Nn≦k<Nw}を生成する。ここで、g(j)は残差ゲイン符号化コードjにより表されるスペクトル残差ゲイン、C(i,k)は残差形状符号化コードiにより表されるスペクトル残差形状ベクトルをそれぞれ示しており、g(j)・C(i,k)は乗算器807から入力される。生成されたフィルタリング部804の出力スペクトル{S(k);Nn≦k<Nw}はスケーリング部809へ出力される。
スペクトル残差形状符号帳805は、分離部801から入力された残差形状符号化コードを復号し、復号結果に対応するスペクトル残差形状ベクトルC(i,k)を乗算器807へ出力する。
スペクトル残差ゲイン符号帳806は、分離部801から入力された残差ゲイン符号化コードを復号し、復号結果に対応するスペクトル残差ゲインg(j)を乗算器807へ出力する。
乗算器807は、スペクトル残差形状符号帳805から入力されたスペクトル残差形状ベクトルC(i,k)と、スペクトル残差ゲイン符号帳806から入力されたスペクトル残差ゲインg(j)と、の乗算結果をフィルタリング部804へ出力する。
スケールファクタ復号化部808は、分離部801から入力されたスケールファクタ符号化コードを復号し、復号されたスケールファクタをスケーリング部809へ出力する。
スケーリング部809は、フィルタリング部804から与えられた出力スペクトル{S(k);Nn≦k<Nw}に、スケールファクタ復号化部808から入力されたスケール
ファクタを乗じて、その乗算結果をスペクトル合成部810に出力する。
スペクトル合成部810は、周波数領域変換部702より与えられる第1レイヤ復号スペクトル{S1(k);0≦k<Nn}と、スケーリング部809から出力されるスケーリング後の生成スペクトルバッファの高域部{S(k);Nn≦k<Nw}を結合して得られるスペクトルを第2の復号スペクトルとして時間領域変換部703に出力する。
(実施の形態2)
図9に、本発明の実施の形態2に係る第2レイヤ符号化部105の構成を示す。図9において図2と同一名称を持つブロックは、同様の機能を有するので、ここではその詳細な説明を省略する。図2と図9の違いは、周波数領域変換部201と拡張帯域符号化部202との間に第1スペクトル符号化部901が存在する点にある。第1スペクトル符号化部901は、周波数領域変換部201より出力される第1レイヤ復号スペクトルの品質を向上させ、そのときの符号化コード(第1のスペクトル符号化コード)を多重化部104に出力するとともに、品質向上された第1レイヤ復号スペクトル(第1の復号スペクトル)を拡張帯域符号化部202に与える。拡張帯域符号化部202は、前述の処理を第1の復号スペクトルを用いて行い、その結果として拡張帯域符号化コードを出力する。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コードと第1のスペクトル符号化コードとの組み合わせからなる。したがって、本実施の形態では、多重化部104は、第1レイヤ符号化コード、拡張帯域符号化コードおよび第1のスペクトル符号化コードを多重化して、ビットストリームを生成する。
次に、第1スペクトル符号化部901の詳細を、図10を用いて説明する。第1スペクトル符号化部901は、スケーリング係数符号化部1001、スケーリング係数復号化部1002、微細スペクトル符号化部1003、多重化部1004、微細スペクトル復号化部1005、正規化部1006、減算器1007および加算器1008を有する。
減算器1007は、原スペクトルから第1レイヤ復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1001および正規化部1006に出力する。スケーリング係数符号化部1001は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、その符号化コードを多重化部1004およびスケーリング係数復号化部1002に出力する。
スケーリング係数の符号化においては、聴覚マスキングを用いても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。これにより、スケーリング係数の符号化を効率化することができる。
スケーリング係数復号化部1002は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1006、微細スペクトル符号化部1003および微細スペクトル復号化部1005に出力する。
正規化部1006は、スケーリング係数復号化部1002より与えられるスケーリング係数を用いて、減算器1007より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1003に出力する。
微細スペクトル符号化部1003は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられるビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル
)の符号化を行う。そして、この符号化によって得られた微細スペクトル符号化コードを多重化部1004および微細スペクトル復号化部1005に出力する。
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル符号化部1003へ入力するように構成する。
スケーリング係数符号化部1001および微細スペクトル符号化部1003より出力される符号化コードは、多重化部1004にて多重化され、第1のスペクトル符号化コードとして多重化部104に出力される。
微細スペクトル復号化部1005は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられたビット数を求め、スケーリング係数と微細スペクトル符号化部1003から入力された微細スペクトル符号化コードとから各帯域の残差スペクトルを復号し、復号された残差スペクトルを加算器1008へ出力する。なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1005へ入力するように構成する。
加算器1008は、復号された残差スペクトルと第1レイヤ復号スペクトルとを加算して第1の復号スペクトルを生成し、生成された第1の復号スペクトルを拡張帯域符号化部202へ出力する。
このように本実施の形態によれば、第1レイヤ復号スペクトルの品質を改善した後に、品質改善後のスペクトル、つまり第1のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成することにより、帯域拡張された復号信号の品質を改善することができる。
本実施の形態の第2レイヤ復号化部603の構成を、図11を用いて詳細に行う。図11において図7と同一名称のブロックは、同一の機能を有するため、ここではその詳細な説明を省略する。図11において、第2レイヤ復号化部603は、分離部1101、第1スペクトル復号化部1102、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
分離部1101は、第2レイヤ符号化コードを、第1のスペクトル符号化コード、拡張帯域符号化コード、に分離し、第1のスペクトル符号化コードを第1スペクトル復号化部1102に、拡張帯域符号化コードを拡張帯域復号化部701に、それぞれ出力する。
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、このパラメータを第1レイヤ復号スペクトルとして第1スペクトル復号化部1102に出力する。
第1スペクトル復号化部1102は、分離部1101から入力された第1のスペクトル符号化コードを復号して得られる第1レイヤの符号化誤差の量子化スペクトルを、周波数領域変換部702から入力された第1レイヤ復号スペクトルに加える。そして、その加算結果を第1の復号スペクトルとして拡張帯域復号化部701へ出力する。
ここで、第1スペクトル復号化部1102の説明を、図12を用いて詳細に行う。第1スペクトル復号化部1102は、分離部1201、スケーリング係数復号化部1202、
微細スペクトル復号化部1203およびスペクトル復号部1204を有する。
分離部1201は、入力された第1のスペクトル符号化コードから、スケーリング係数を表す符号化コードと、微細スペクトル(スペクトル微細構造)を表す符号化コードと、を分離し、スケーリング係数符号化コードをスケーリング係数復号化部1202に、微細スペクトル符号化コードを微細スペクトル復号化部1203に、それぞれ出力する。
スケーリング係数復号化部1202は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数をスペクトル復号部1204および微細スペクトル復号化部1203に出力する。
微細スペクトル復号化部1203は、スケーリング係数復号化部1202から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域の微細スペクトルに割り当てられたビット数を求める。また、分離部1201から入力された微細スペクトル符号化コードから各帯域の微細スペクトルを復号し、復号された微細スペクトルをスペクトル復号部1204へ出力する。
なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1203へ入力するように構成する。
スペクトル復号部1204は、周波数領域変換部702から与えられた第1レイヤ復号スペクトルと、スケーリング係数復号化部1202から入力されたスケーリング係数と、微細スペクトル復号化部1203から入力された微細スペクトルと、から第1の復号スペクトルを復号し、この復号スペクトルを拡張帯域復号化部701へ出力する。
なお、本実施の形態の拡張帯域符号化部202には、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307を設けなくとも良い。この場合の拡張帯域符号化部202の構成は、図13に示される。また、拡張帯域復号化部701には、スペクトル残差形状符号帳805およびスペクトル残差ゲイン符号帳806を設けなくとも良い。この場合の拡張帯域復号化部701の構成は、図14に示される。なお、図13および図14にそれぞれ示されるフィルタリング部1301、1401の出力信号は、次の式(6)で表される。
Figure 2006049204
本実施の形態では、第1レイヤ復号スペクトルの品質を改善した後に、この品質改善後のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成する。この構成によれば、復号信号の品質を改善することができる。この利点は、スペクトル残差形状符号帳およびスペクトル残差ゲイン符号帳の有無に関わらず享受できる。
なお、第1スペクトル符号化部901では、低域部(0≦k<Nn)のスペクトルの符号化を行う際に、全帯域(0≦k<Nw)の符号化歪が最も小さくなるように低域部(0≦k<Nn)のスペクトルの符号化を行っても良い。この場合、拡張帯域符号化部202では、高域部(Nn≦k<Nw)の符号化まで行われる。また、この場合、第1スペクトル符号化部901において、低域部の符号化結果が高域部の符号化に与える影響も考慮して低域部の符号化を行うことになる。したがって、全帯域のスペクトルが最適になるよう低域部のスペクトルの符号化が為されるようになるため、品質が向上するという効果が得
られる。
(実施の形態3)
本発明の実施の形態3に係る第2レイヤ符号化部105の構成を図15に示す。図15において図9と同一名称のブロックは同一の機能を有するため、ここではその詳細な説明を省略する。
図9との違いは、復号機能を有し且つ拡張帯域符号化コードを求める拡張帯域符号化部1501と、その拡張帯域符号化コードを用いて第2の復号スペクトルを生成し原スペクトルから第2の復号スペクトルを減じて求められる誤差スペクトルを符号化する第2スペクトル符号化部1502と、が設けられた点にある。前述の誤差スペクトルを第2スペクトル符号化部1502にて符号化することでより高品質な復号スペクトルを生成できるようになり、復号化装置で得られる復号信号の品質を向上させることができる。
拡張帯域符号化部1501は、図3に示された拡張帯域符号化部202と同様に拡張帯域符号化コードを生成して出力する。また、拡張帯域符号化部1501は、図8に示される拡張帯域復号化部701と同様の構成を内包し、拡張帯域復号化部701と同様に第2の復号スペクトルを生成する。この第2の復号スペクトルは、第2スペクトル符号化部1502に出力される。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コード、第1のスペクトル符号化コードおよび第2のスペクトル符号化コードからなる。
なお、拡張帯域符号化部1501の構成において、図3および図8で共通の名称を持つブロックは共有化されていても良い。
第2スペクトル符号化部1502は、図16に示すように、スケーリング係数符号化部1601、スケーリング係数復号化部1602、微細スペクトル符号化部1603、多重化部1604、正規化部1605および減算器1606を有する。
減算器1606は、原スペクトルから第2の復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1601および正規化部1605に出力する。スケーリング係数符号化部1601は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、スケーリング係数符号化コードを多重化部1604およびスケーリング係数復号化部1602に出力する。
ここで、聴覚マスキングを用いてスケーリング係数の符号化の効率化を図っても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。
スケーリング係数復号化部1602は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1605および微細スペクトル符号化部1603に出力する。
正規化部1605は、スケーリング係数復号化部1602より与えられるスケーリング係数を用いて、減算器1606より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1603に出力する。
微細スペクトル符号化部1603は、スケーリング係数復号化部1602から入力された復号スケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられ
たビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル)の符号化を行う。そして、この符号化によって得られた符号化コードを多重化部1604に出力する。
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第2レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第2レイヤ復号スペクトルを微細スペクトル符号化部1603へ入力するように構成する。
スケーリング係数符号化部1601および微細スペクトル符号化部1603より出力される符号化コードは多重化部1604にて多重化され、第2のスペクトル符号化コードとして出力される。
図17は、第2スペクトル符号化部1502の構成の変形例を示している。図17において図16と同一名称のブロックは同一機能を有するため、ここではその詳細な説明を省略する。
この構成では、第2スペクトル符号化部1502は、減算器1606より与えられる残差スペクトルを直接符号化する。つまり、残差スペクトルの正規化は行われない。そのため本構成では、図16に示されたスケーリング係数符号化部1601、スケーリング係数復号化部1602および正規化部1605が設けられていない。この構成によれば、第2スペクトル符号化部1502でスケーリング係数にビットを配分する必要が無くなるため、ビットレートを低減させることができる。
聴覚重要度およびビット配分算出部1701は、第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度およびビット配分は、微細スペクトル符号化部1603へ出力される。
微細スペクトル符号化部1603は、聴覚重要度およびビット配分算出部1701から入力された聴覚重要度およびビット配分に基づいて、残差スペクトルを符号化する。そして、この符号化によって得られた符号化コードを第2のスペクトル符号化コードとして多重化部104に出力する。なお、残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。
本実施の形態の第2レイヤ復号化部603の構成を図18に示す。第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702、時間領域変換部703、分離部1101、第1スペクトル復号化部1102および第2スペクトル復号化部1801を有する。図18において図11と同一名称のブロックは同一の機能を有するので、ここではその詳細な説明を省略する。
第2スペクトル復号化部1801は、分離部1101から入力された第2のスペクトル符号化コードを復号して得られる第2の復号スペクトルの符号化誤差を量子化したスペクトルを、拡張帯域復号化部701から入力された第2の復号スペクトルに加える。そして、この加算結果を第3の復号スペクトルとして時間領域変換部703へ出力する。
第2スペクトル復号化部1801は、第2スペクトル符号化部1502が図16に示す構成を採る場合、図12と同様の構成を採る。ただし、図12における第1のスペクトル符号化コード、第1レイヤ復号スペクトルおよび第1の復号スペクトルは、それぞれ、第2のスペクトル符号化コード、第2の復号スペクトルおよび第3の復号スペクトルに置き換わる。
また、本実施の形態では、第2スペクトル復号化部1801の構成について、第2スペクトル符号化部1502が図16に示す構成を採る場合を例に挙げて説明したが、第2スペクトル符号化部1502が図17に示す構成を採る場合、第2スペクトル復号化部1801の構成は、図19のようになる。
つまり図19は、スケーリング係数を用いない第2スペクトル符号化部1502に対応する第2スペクトル復号化部1801の構成を示している。第2スペクトル復号化部1801は、聴覚重要度およびビット配分算出部1901と微細スペクトル復号化部1902とスペクトル復号部1903とを有する。
図19において、聴覚重要度およびビット配分算出部1901は、拡張帯域復号化部701から入力された第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度とビット配分は、微細スペクトル復号化部1902へ出力される。
微細スペクトル復号化部1902は、聴覚重要度およびビット配分算出部1901から入力された聴覚重要度およびビット配分に基づいて、分離部1101から第2のスペクトル符号化コードとして入力される微細スペクトル符号化コードを復号し、その復号結果(各帯域の微細スペクトル)をスペクトル復号部1903に出力する。
微細スペクトル復号化部1903は、拡張帯域復号化部701から入力された第2の復号スペクトルに、微細スペクトル復号化部1902から入力された微細スペクトルを加えて、その加算結果を第3の復号スペクトルとして外部へ出力する。
なお、本実施の形態では、第1スペクトル符号化部901および第1スペクトル復号化部1102を含む構成を例に挙げて説明したが、第1スペクトル符号化部901および第1スペクトル復号化部1102が無くても本実施の形態の作用効果を実現することができる。その場合の第2レイヤ符号化部105の構成を図20に、第2レイヤ復号化部603の構成を図21に、それぞれ示す。
以上、本発明によるスケーラブル復号化装置およびスケーラブル符号化装置の実施の形態について説明した。
なお、上記実施の形態においては、変換方式としてMDCTを使って説明したがこれに限定されず、他の変換方式、例えばフーリエ変換やコサイン変換、Wavelet変換などを使用したときにも本発明は適用できる。
また、上記実施の形態においては、階層数2を基に説明したがこれに限定されず、2以上の階層を持つスケーラブル符号化/復号化にも適用できる。
また、本発明に係る符号化装置および復号化装置は、上記の実施の形態1〜3に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発
明はソフトウェアで実現することも可能である。
なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
すなわち、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1パラメータ算出手段は、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを前記第1パラメータとして出力する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第2パラメータ算出手段は、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳を有し、前記スペクトル残差の符号を前記第2パラメータとして出力する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、前記第1パラメータ算出手段および前記第2パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記残差成分符号化手段は、前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1
パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。
また、上記実施の形態に係るスケーラブル復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。
また、上記実施の形態に係るスケーラブル符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
また、上記実施の形態に係るスケーラブル復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。
特に、本発明による第1のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定し、フィルタ情報を符号化して送るスペクトル符号化装置において、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を有し、前記フィルタの入力信号としてスペクトル残差を与えフィルタリングを行い第2スペクトルの高域部を推定するもので、スペクトル残差を用いることにより、第1スペクトルの変形では表せない第2スペクトルの高域部の成分を符号化するこ
とができるようになるため、第2スペクトルの高域部の推定性能が向上し高品質化が為される。
また、本発明による第2のスケーラブル符号化装置は、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化して第1スペクトルの高品質化を図った後に、この第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定するもので、第2スペクトルの低域部に対する第1スペクトルの品質を改善させた後に、品質改善後の第1スペクトルを用いて第2スペクトルの高域部を推定することにより、推定性能が向上し高品質化が為される。
また、本発明による第3のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定して生成される推定スペクトルと第2スペクトルの高域部の間の誤差成分と、第2スペクトルの低域部と第1スペクトルの間の誤差成分の両誤差成分を小さくするように、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化するもので、第1スペクトルと第2スペクトルの低域部の間の誤差成分を符号化する際に、第1スペクトルおよび第2スペクトルの高域部の推定スペクトルの両品質が同時に向上する第1スペクトルの符号化が為されるため、高品質化が実現できる。
また、上記第1〜3のスケーラブル符号化装置においては、符号化装置にて復号化装置に伝送されるビットストリームを生成する際に、当該ビットストリームは少なくとも、スケールファクタ、ダイナミックレンジ調整係数、ラグ、を含み、この順番でビットストリームを構成するようにしてもよい。これにより、ビットストリームの構成は復号信号の品質に与える影響が大きいパラメータほどビットストリームのMSB(Most Significant Bit)の近くに配置されているため、ビットストリームのLSB(Least Significant Bit)から任意のビット位置でビットが削除されても品質劣化が生じ難いという効果が得られる。
本明細書は、2004年11月5日出願の特願2004−322959に基づく。この内容はすべてここに含めておく。
本発明に係る符号化装置、復号化装置、符号化方法及び復号化方法は、スケーラブル符号化/復号化等に適用できる。
本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域符号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域符号化部のフィルタリング部で処理される生成スペクトルバッファを示す模式図 本発明の実施の形態1に係る符号化装置の多重化部から出力されるビットストリームの内容を示す模式図 本発明の実施の形態1に係る復号化装置の構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態1に係る拡張帯域復号化部の構成を示すブロック図 本発明の実施の形態2に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態2に係る第1スペクトル符号化部の構成を示すブロック図 本発明の実施の形態2に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態2に係る第1スペクトル復号化部の構成を示すブロック図 本発明の実施の形態2に係る拡張帯域符号化部の構成を示すブロック図 本発明の実施の形態2に係る拡張帯域復号化部の構成を示すブロック図 本発明の実施の形態3に係る第2レイヤ符号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル符号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル符号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ復号化部の構成を示すブロック図 本発明の実施の形態3に係る第2スペクトル復号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ符号化部の構成の変形例を示すブロック図 本発明の実施の形態3に係る第2レイヤ復号化部の構成の変形例を示すブロック図

Claims (10)

  1. 原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、
    前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、
    前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、
    前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、
    前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、
    算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、
    を有する符号化装置。
  2. 前記第1パラメータ算出手段は、
    前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを前記第1パラメータとして出力する、
    請求項1記載の符号化装置。
  3. 前記第2パラメータ算出手段は、
    スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳を有し、前記スペクトル残差の符号を前記第2パラメータとして出力する、
    請求項1記載の符号化装置。
  4. 前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、
    前記第1パラメータ算出手段および前記第2パラメータ算出手段は、
    前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する、
    請求項1記載の符号化装置。
  5. 前記残差成分符号化手段は、
    前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる、
    請求項4記載の符号化装置。
  6. 前記第1パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、
    前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する、
    請求項1記載の符号化装置。
  7. 原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、
    前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、
    前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、
    前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、
    前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、
    前記パラメータ算出手段は、
    前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する、
    符号化装置。
  8. 低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、
    高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、
    取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、
    を有する復号化装置。
  9. 原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、
    前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、
    前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、
    前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、
    前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、
    算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
    を有する符号化方法。
  10. 低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、
    高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、
    取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、
    を有する復号化方法。
JP2006542421A 2004-11-05 2005-11-02 符号化装置及び符号化方法 Active JP4977471B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006542421A JP4977471B2 (ja) 2004-11-05 2005-11-02 符号化装置及び符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004322959 2004-11-05
JP2004322959 2004-11-05
JP2006542421A JP4977471B2 (ja) 2004-11-05 2005-11-02 符号化装置及び符号化方法
PCT/JP2005/020200 WO2006049204A1 (ja) 2004-11-05 2005-11-02 符号化装置、復号化装置、符号化方法及び復号化方法

Publications (2)

Publication Number Publication Date
JPWO2006049204A1 true JPWO2006049204A1 (ja) 2008-05-29
JP4977471B2 JP4977471B2 (ja) 2012-07-18

Family

ID=36319209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542421A Active JP4977471B2 (ja) 2004-11-05 2005-11-02 符号化装置及び符号化方法

Country Status (9)

Country Link
US (3) US7769584B2 (ja)
EP (3) EP1798724B1 (ja)
JP (1) JP4977471B2 (ja)
KR (1) KR101220621B1 (ja)
CN (3) CN102184734B (ja)
BR (1) BRPI0517716B1 (ja)
ES (1) ES2476992T3 (ja)
RU (2) RU2387024C2 (ja)
WO (1) WO2006049204A1 (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
BRPI0616624A2 (pt) 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
EP2381440A3 (en) * 2005-11-30 2012-03-21 Panasonic Corporation Subband coding apparatus and method of coding subband
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5058152B2 (ja) * 2006-03-10 2012-10-24 パナソニック株式会社 符号化装置および符号化方法
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
DE602007013026D1 (de) * 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
JP5116677B2 (ja) * 2006-08-22 2013-01-09 パナソニック株式会社 軟出力復号器、反復復号装置、及び軟判定値算出方法
WO2008056775A1 (fr) 2006-11-10 2008-05-15 Panasonic Corporation Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4638895B2 (ja) * 2007-05-21 2011-02-23 日本電信電話株式会社 復号方法、復号器、復号装置、プログラムおよび記録媒体
JP5098530B2 (ja) * 2007-09-12 2012-12-12 富士通株式会社 復号化装置、復号化方法および復号化プログラム
US8548815B2 (en) * 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
JP5449133B2 (ja) * 2008-03-14 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
CN101609684B (zh) * 2008-06-19 2012-06-06 展讯通信(上海)有限公司 解码语音信号的后处理滤波器
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
CN101436407B (zh) * 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
KR101661374B1 (ko) * 2009-02-26 2016-09-29 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치 및 이들 방법
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
PT2491553T (pt) 2009-10-20 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
MX2012008075A (es) 2010-01-12 2013-12-16 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo.
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
KR101819180B1 (ko) * 2010-03-31 2018-01-16 한국전자통신연구원 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
RU2445719C2 (ru) * 2010-04-21 2012-03-20 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием
JP2011253045A (ja) * 2010-06-02 2011-12-15 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
EP4372742A2 (en) 2010-07-08 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coder using forward aliasing cancellation
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012052802A1 (en) * 2010-10-18 2012-04-26 Nokia Corporation An audio encoder/decoder apparatus
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6010539B2 (ja) * 2011-09-09 2016-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法および復号方法
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
WO2013061530A1 (ja) 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法
MX346012B (es) * 2013-01-29 2017-02-28 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal codificada y codificador y metodo par a generar una señal codificada.
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN105745703B (zh) * 2013-09-16 2019-12-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
KR102251833B1 (ko) 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
WO2015122752A1 (ko) 2014-02-17 2015-08-20 삼성전자 주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
CN106233112B (zh) * 2014-02-17 2019-06-28 三星电子株式会社 信号编码方法和设备以及信号解码方法和设备
MX361028B (es) 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9911179B2 (en) * 2014-07-18 2018-03-06 Dolby Laboratories Licensing Corporation Image decontouring in high dynamic range video processing
CN107077855B (zh) 2014-07-28 2020-09-22 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
US10609372B2 (en) * 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP2964879B2 (ja) * 1994-08-22 1999-10-18 日本電気株式会社 ポストフィルタ
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3765171B2 (ja) * 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
EP1440433B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
CN1288625C (zh) * 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
ATE480851T1 (de) * 2004-10-28 2010-09-15 Panasonic Corp Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Also Published As

Publication number Publication date
RU2007116941A (ru) 2008-11-20
CN101048814B (zh) 2011-07-27
CN102184734A (zh) 2011-09-14
EP1798724A1 (en) 2007-06-20
KR101220621B1 (ko) 2013-01-18
US20100256980A1 (en) 2010-10-07
EP1798724A4 (en) 2008-09-24
KR20070083997A (ko) 2007-08-24
US7769584B2 (en) 2010-08-03
CN102201242B (zh) 2013-02-27
US8135583B2 (en) 2012-03-13
US20080052066A1 (en) 2008-02-28
CN102184734B (zh) 2013-04-03
RU2387024C2 (ru) 2010-04-20
JP4977471B2 (ja) 2012-07-18
EP2752849A1 (en) 2014-07-09
RU2009147514A (ru) 2011-06-27
BRPI0517716B1 (pt) 2019-03-12
US8204745B2 (en) 2012-06-19
WO2006049204A1 (ja) 2006-05-11
US20110264457A1 (en) 2011-10-27
EP1798724B1 (en) 2014-06-18
EP2752843A1 (en) 2014-07-09
CN101048814A (zh) 2007-10-03
CN102201242A (zh) 2011-09-28
RU2500043C2 (ru) 2013-11-27
ES2476992T3 (es) 2014-07-15
BRPI0517716A (pt) 2008-10-21
EP2752849B1 (en) 2020-06-03

Similar Documents

Publication Publication Date Title
JP4977471B2 (ja) 符号化装置及び符号化方法
JP4977472B2 (ja) スケーラブル復号化装置
JP4871894B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JP4859670B2 (ja) 音声符号化装置および音声符号化方法
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP5013863B2 (ja) 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
JP5089394B2 (ja) 音声符号化装置および音声符号化方法
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP4954069B2 (ja) ポストフィルタ、復号化装置及びポストフィルタ処理方法
US20090262945A1 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
US20100017197A1 (en) Voice coding device, voice decoding device and their methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Ref document number: 4977471

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3