JPWO2011086900A1 - 符号化装置および符号化方法 - Google Patents

符号化装置および符号化方法 Download PDF

Info

Publication number
JPWO2011086900A1
JPWO2011086900A1 JP2011549931A JP2011549931A JPWO2011086900A1 JP WO2011086900 A1 JPWO2011086900 A1 JP WO2011086900A1 JP 2011549931 A JP2011549931 A JP 2011549931A JP 2011549931 A JP2011549931 A JP 2011549931A JP WO2011086900 A1 JPWO2011086900 A1 JP WO2011086900A1
Authority
JP
Japan
Prior art keywords
spectrum
encoding
subband
unit
encoding device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011549931A
Other languages
English (en)
Other versions
JP5606457B2 (ja
Inventor
智史 山梨
智史 山梨
押切 正浩
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011549931A priority Critical patent/JP5606457B2/ja
Publication of JPWO2011086900A1 publication Critical patent/JPWO2011086900A1/ja
Application granted granted Critical
Publication of JP5606457B2 publication Critical patent/JP5606457B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

極低ビットレートという条件下において、低演算量で、復号信号の品質を改善することができる符号化装置および符号化方法。スペクトル補正部(302)は、各サブバンドのサブスペクトルに対して、サブスペクトル平均値以上のサンプルに対しては何もせず、サブスペクトル平均値未満のサンプルをゼロにするという補正処理を施す。これによって、近傍探索部(303)、およびマルチレートインデキシング部(304)において、大きな品質劣化なしに、サブスペクトルを量子化するために必要なビット数を大きく減らすことができる。

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置および符号化方法に関する。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、処理演算量が少ない符号化技術、またマルチレート符号化技術に対するニーズが高まっている。
このようなニーズに対して、符号化後の情報量を大幅に増加させることなく、低演算量にて音声・楽音信号を符号化する様々な技術が開発されてきている。例えば、一定時間分の入力信号を変換して得られるスペクトルデータに対して、複数のサブベクトルに分割し、各サブベクトルに対してマルチレート符号化する技術が開示されている(非特許文献1)。なお、上記非特許文献1に開示されているEAVQ(Embedded Algebraic Vector Quantization)に関連する技術は非特許文献2、非特許文献3、および特許文献1にも開示されている。
特表2005−528839号
Stephane Ragot, Bruno Bessette, and Roch Lefebvre, "Low-complexity Multi-rate Lattice Vector Quantization with Application to Wideband TCX Speech Coding", ICASSP 2004 Minjie Xie and Jean-Pierre Adoul, "Embedded Algebraic Vector Quantizers (EAVQ) with Application to Wideband Speech Coding", IEEE 1996 ITU-T:G.718; Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. ITU-T Recommendation G.718(2008)
しかしながら、上記先行技術文献に開示されたベクトル量子化技術は、演算量が小さいという利点を有する一方、符号化ビットレートが非常に低い場合には復号信号の品質が大幅に低下するという問題点がある。例えば、非特許文献3に開示されているAVQ符号化方式では4kbit/sまたは12kbit/sのビットレートにて符号化処理を行っている。また、各サブベクトルの量子化に、1/4/8/16ビット/フレーム(但しボロノイ拡張符号化に用いるビットは除く)を用いる。ここで、符号化ビットレートが4kbit/sの場合を例に挙げて説明する。非特許文献3に開示されている符号化方式においては、サブバンドエネルギの高いサブバンドから順に量子化されるが、仮に16ビット/フレームで量子化される場合には、4kbit/sではわずか数サブバンドほどしか量子化できない場合がある。この場合、帯域全体に対して、量子化したサブバンドの占める帯域は非常に少なく(例えば35サブバンド中の3〜4サブバンド程度、等)、その結果、復号信号の品質が不十分になり得る。
本発明の目的は、極低ビットレートという条件下において、低演算量で、復号信号の品質を改善することができる符号化装置および符号化方法を提供することである。
本発明の符号化装置の一態様は、入力信号を直交変換してスペクトルデータを形成する直交変換手段と、前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正手段と、前記補正処理されたスペクトルデータをラティスベクトル(格子ベクトル)に変換する変換手段と、を備える。
本発明の符号化方法の一態様は、入力信号を直交変換してスペクトルデータを形成するステップと、前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正ステップと、前記補正処理されたスペクトルデータをラティスベクトル(格子ベクトル)に変換する変換ステップと、を具備する。
本発明によれば、非常に低いビットレートで、かつ非常に低い処理演算量で、広い帯域のスペクトルデータを符号化し、復号信号の品質を改善することができる。
本発明の一実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図 図1に示した符号化装置の内部の主要な構成を示すブロック図 図2に示したAVQ符号化部の内部の主要な構成を示すブロック図 図1に示した復号装置の内部の主要な構成を示すブロック図 図4に示したAVQ復号部の内部の主要な構成を示すブロック図
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。
図1は、本発明の一実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図1において、通信システムは、符号化装置101と復号装置103とを備える。符号化装置101と復号装置103とは、伝送路102を介して通信可能な状態となっている。なお、符号化装置および復号装置はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。
符号化装置101は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。すなわち、Nサンプルが符号化処理単位とされる。ここで、各符号化処理単位に対応する入力信号をx(n=0、…、N−1)と表すこととする。nは、入力信号がNサンプルずつ区切られた信号要素群のうち、n+1番目を示す。符号化装置101は、符号化によって得られた情報(以下「符号化情報」という)を、伝送路102を介して復号装置103に送信する。
復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、これを復号し出力信号を得る。
図2は、図1に示した符号化装置101の内部の主要な構成を示すブロック図である。符号化装置101は、直交変換処理部201およびAVQ符号化部202から主に構成される。各部は以下の動作を行う。
直交変換処理部201は、バッファbuf1(n=0、…、N−1)を内部に有する。直交変換処理部201は、入力信号xを修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)する。
ここで、直交変換処理部201における直交変換(時間−周波数変換)処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
まず、直交変換処理部201は、下記の式(1)によりバッファbuf1を、「0」を初期値として初期化する。
Figure 2011086900
次いで、直交変換処理部201は、下記の式(2)に従って、入力信号xに対し修正離散コサイン変換(MDCT)を行う。これにより、直交変換処理部201は、入力信号のMDCT係数(以下、入力スペクトルと呼ぶ)X(k)を求める。
Figure 2011086900
kは1フレームにおける各サンプルのインデックスを示す。
直交変換処理部201は、入力信号xとバッファbuf1とを結合させたベクトルであるx’を下記の式(3)により求める。
Figure 2011086900
次に、直交変換処理部201は、式(4)によりバッファbuf1を更新する。
Figure 2011086900
そして、直交変換処理部201は、式(2)によって得られた入力スペクトルX(k)をAVQ符号化部202に出力する。
AVQ符号化部202は、直交変換処理部201から入力される入力スペクトルX(k)を用いて符号化情報を生成する。AVQ符号化部202は、生成した符号化情報を伝送路102に出力する。
図3は、AVQ符号化部202の内部の主要な構成を示すブロック図である。AVQ符号化部202は、グローバルゲイン算出部301、スペクトル補正部302、近傍探索部303、マルチレートインデキシング部304、および多重化部305から主に構成される。各部は以下の動作を行う。
グローバルゲイン算出部301は、直交変換処理部201から入力される入力スペクトルX(k)に対するグローバルゲインを算出する。グローバルゲインの算出方法については、非特許文献3に開示されており、本実施の形態における算出方法も同一方法である。具体的には、グローバルゲイン算出部301は、以下の式(5)および式(6)に従って、グローバルゲインgを算出する。グローバルゲイン算出部301は、式(6)に従って算出したグローバルゲインを多重化部305に出力する。ここで、式(5)におけるNB_BITSは符号化処理に利用できるビット数を表し、Pは入力スペクトルX(k)を分割するサブバンド数を表すものとする。
Figure 2011086900
Figure 2011086900
より詳細には、式(5)における1段目には、初期化に関する式が記載されている。そして、初期化の後に、式(5)では、3段目に記載された式による、第1のオフセット計算が行われる。一方で、6,7段目に記載された式による、第2のオフセット計算も行われる。また、4段目に記載された式により、nbitsが求められる。そして、5段目の条件に基づいて、第1のオフセット計算によって求められたオフセット、又は、第2のオフセット計算によって求められたオフセットが選択される。すなわち、5段目の条件が満たされない場合には、第1のオフセット計算によって求められたオフセットが選択される。一方、5段目の条件が満たされる場合には、第2のオフセット計算によって求められたオフセットが選択される。
そして、式(6)では、式(5)で選択されたオフセットに基づいて、グローバルゲインgが求められる。このグローバルゲインgは、多重化部305へ出力される。
また、グローバルゲイン算出部301は、式(6)により算出したグローバルゲインgを用いて入力スペクトルX(k)を式(7)に従って正規化し、正規化した入力スペクトルX2(k)をスペクトル補正部302に出力する。
Figure 2011086900
スペクトル補正部302は、グローバルゲイン算出部301における処理と同様に、グローバルゲイン算出部301から入力される正規化された入力スペクトルX2(k)をP個のサブバンドに分割する。ここで、P個の各サブバンドを構成するサンプル(MDCT係数)の数、つまりサブバンド幅をそれぞれQ(p)とする。なお、以下では、説明の簡略化のため、各サブバンド幅が全てQである場合について説明するが、もちろん本発明はサブバンド毎にサブバンド幅が異なる場合についても同様に適用できる。
スペクトル補正部302は、P個に分割した各サブバンドのスペクトルに対して、補正処理を行う。なお、以下の説明では、各サブバンドのスペクトルをサブスペクトルSS(k)(p=0、・・・、P−1、k=BS、・・・、BE)と呼ぶ。また、補正処理を施したサブスペクトルを補正サブスペクトルMSS(k)(p=0、・・・、P−1、k=BS、・・・、BE)と呼ぶ。ここで、BS、およびBEは各サブバンドの先頭サンプルのインデックス、および最終サンプルのインデックスをそれぞれ表す。
ここで、スペクトル補正部302におけるサブスペクトルの補正方法について説明する。
まず、スペクトル補正部302は、各サブバンドに対して、以下の式(8)に従って、サブスペクトルSS(k)の平均振幅値Aveを算出する。
Figure 2011086900
次に、スペクトル補正部302は、式(8)により算出したサブスペクトル平均値Aveを用いて、以下の式(9)に従って、各サブバンドのサブスペクトルを補正し、補正サブスペクトルMSS(k)を算出する。
Figure 2011086900
つまり、スペクトル補正部302は、各サブバンドのサブスペクトルに対して、サブスペクトル平均値以上のサンプルに対しては何もせず、サブスペクトル平均値未満のサンプルをゼロにするという補正処理を施す。
スペクトル補正部302において、上記のような処理を行うことにより、サブスペクトルは、相対的に振幅の大きいサンプル(つまり、聴感的に重要なサンプル)以外はすべてゼロというサブスペクトルに補正される。すなわち、スペクトル補正部302において、上記のような処理を行うことにより、サブスペクトルは、その特徴が強調されると共に、単純化される。これによって、後述する近傍探索部303、およびマルチレートインデキシング部304において、大きな品質劣化なしに、サブスペクトルを量子化するために必要なビット数を大きく減らすことができる。その結果、符号化するサブバンド数を増やすことができるため、復号信号の帯域感(帯域の広さ)を向上させることができる。具体例は後述する。
次に、スペクトル補正部302は、補正サブスペクトルMSS(k)を近傍探索部303に出力する。
近傍探索部303は、スペクトル補正部302から入力される補正サブスペクトルMSS(k)に対して、非特許文献1および非特許文献3で開示されている技術を用いて、補正サブスペクトルMSS(k)の近傍ベクトル(ラティスベクトル(格子ベクトル))を算出する。具体的には、式(10)に従い、REに含まれるサブベクトル(ラティスベクトル)を算出する。ここで、REおよび式(10)の処理の詳細については、非特許文献1、非特許文献2を参照されたい。
Figure 2011086900
近傍探索部303は、算出した近傍ベクトル(式(10)におけるy1pまたはy2p)をマルチレートインデキシング部304に出力する。
マルチレートインデキシング部304は、非特許文献1および非特許文献3で開示されている技術を用いて、近傍探索部303から入力される近傍ベクトルからインデックス情報を算出する。ここで、マルチレートインデキシング部304の処理の詳細については、非特許文献3に開示されているため、ここでは説明を省略する。マルチレートインデキシング部304は、算出したインデックス情報を多重化部305に出力する。
多重化部305は、グローバルゲイン算出部301から入力されるグローバルゲインgと、マルチレートインデキシング部304から入力されるインデックス情報とを多重化して符号化情報を生成し、生成した符号化情報を、伝送路102を介して復号装置103に出力する。
ここで、本発明の効果を示す一例として、例えば、サブスペクトルのサブバンド幅が8である{ -4.4, 0.4, 1.6, 0.3, 4.4, 0.4, -1.6, -0.4 }というサブスペクトル(テストサブスペクトル)を符号化する場合を考える。この時、近傍探索部303において、{ 4, 0, 2, 0, 4, 0, 2, 0 }というベクトルに変換され、さらに{ 4, 4, 2, 2, 0, 0, 0, 0 }というリーダが選択される。このリーダはQ4に属するため、このリーダを符号化するためには16ビットが必要となる。しかし、スペクトル補正部302において、上記テストサブスペクトルに対して上記の補正処理を行うことにより、テストサブスペクトルは補正テストサブスペクトル{ -4.4, 0.0, 0.0, 0.0, 4.4, 0.0, 0.0, 0.0 }に補正される。この補正テストサブスペクトルは、近傍探索部303においては、{ 4, 0, 0, 0, 4, 0, 0, 0 }というベクトルに変換され、さらに{ 4, 4, 0, 0, 0, 0, 0, 0 }というリーダが選択される。このリーダはQ3に属するため、このリーダを符号化するためには、12ビットが必要となる。従って、上述したような、相対的に振幅が大きい、重要なサンプル以外のサンプルの値をゼロ化するというベクトル補正処理を行うことにより、大きな品質劣化なしに、4ビットの情報量を削減することができる。
以上が、符号化装置101の処理説明である。
図4は、図1に示した復号装置103の内部の主要な構成を示すブロック図である。復号装置103は、AVQ復号部401および直交変換処理部402から主に構成される。各部は以下の動作を行う。
AVQ復号部401は、伝送路を介して入力される符号化情報を用いて、復号スペクトルX2’(k)を算出する。AVQ復号部401は、生成した復号スペクトルX2’(k)を直交変換処理部402に出力する。なお、AVQ復号部401の処理の詳細は後述する。
直交変換処理部402は、バッファbuf2(k)を内部に有しており、下記の式(11)に示すようにバッファbuf2(k)を初期化する。
Figure 2011086900
また、直交変換処理部402は、AVQ復号部401から入力される復号スペクトルX2’(k)を用いて下記の式(12)に従い、復号信号yを求めて出力する。
Figure 2011086900
式(12)におけるZ(k)は、下記の式(13)に示すように、復号スペクトルX2’(k)とバッファbuf2(k)とを結合させたベクトルである。
Figure 2011086900
次に、直交変換処理部402は、下記の式(14)に従いバッファbuf2(k)を更新する。
Figure 2011086900
次に、直交変換処理部402は、復号信号yを出力信号として出力する。
図5は、図4に示したAVQ復号部401の内部構成を示すブロック図である。AVQ復号部401は、マルチレート復号部501から主に構成される。マルチレート復号部501は、伝送路を介して符号化装置101から送られる符号化情報を入力とし、入力された符号化情報を、AVQ符号化部202内のマルチレートインデキシング部304の処理の逆処理によって復号し、復号スペクトルX2’(k)を算出する。ここで、マルチレート復号部501の処理の詳細については、非特許文献3に開示されているため、ここでは説明を省略する。基本的には、マルチレートインデキシング部304の逆処理を行い、復号スペクトルX2’(k)を算出する。
以上が、復号装置103の処理説明である。
このように、本実施の形態によれば、AVQ技術を用いて符号化を行う場合において、符号化対象とするスペクトルに対して補正処理を施すことにより、非常に低いビットレートで、かつ低い処理演算量で、復号信号の品質を改善することができる。具体的には、補正処理では、AVQ技術において低いビットレートで量子化されるようにするために、符号化対象スペクトルは、その構成の特徴が強調されると共に単純化される。本実施の形態では、簡略化処理の一例として、サブスペクトル毎に振幅の平均値を算出し、この平均値未満のサンプルをすべてゼロにするという方法を説明した。このような補正処理により、各サブサブバンドのスペクトル(サブスペクトル)の符号化に必要なビットが少なくなり、同じビットレートで符号化できるサブバンドの数を増やすことができる。その結果、広い帯域のスペクトルデータを量子化することができるため、復号信号の品質(帯域感=帯域の広さ)を向上させることができる。
なお、本実施の形態では、スペクトル補正部302において、サブスペクトル内の振幅の平均値を用いて、平均値未満のサンプルの値をゼロにする方法について説明したが、本発明はこれに限らず、上記以外の方法によって、サブスペクトルを補正する構成についても同様に適用できる。例えば、スペクトル補正部302において、各サンプルに対して、振幅が大きい方から予め定められた数のサンプルのみを選択し、それ以外のサンプルに対しては値をゼロにするという補正処理が行われてもよい。このとき、上記の予め定められた数は、サブバンド毎に変更してもよく、また時間的に変動させてもよい。例えば、重要な低域側のサブバンドでは予め定められた数を大きく設定し、エネルギの小さい高域側のサブバンドでは予め定められた数を小さく設定する、などの方法を採ることもできる。
また、振幅の平均値の代わりに、標準偏差等を算出し、これらを利用してサブスペクトルを補正処理してもよい。
なお、本実施の形態では、入力信号のスペクトルデータそのものをAVQによって符号化する構成について説明したが、本発明はこれに限らず、入力信号の低域部を符号化するコア符号化部をさらに備え、AVQ符号化部202では、コア符号化部から得られるコア復号信号(ローカルデコード信号)と入力信号との残差信号のスペクトルデータを符号化するという構成を有する符号化装置101に対しても同様に適用できる。
なお、本実施の形態では、近傍探索部303における処理は非特許文献1、および非特許文献3に開示されている方式と同じ処理を行う場合について説明したが、本発明はこれに限らず、近傍探索部303において、スペクトル補正部302の処理により適合するような処理をする場合についても同様に適用できる。例えば、非特許文献1、および非特許文献3では、Qnに属するベクトルのうち、幾つか選択したベクトルをリーダとしてコードブックに定義し符号化に利用している。この時、リーダとしてコードブック定義するベクトルついて、スペクトル補正部302によって補正されるようなベクトルを優先的に選択する。これによって、対象とするサブスペクトル(補正サブスペクトル)の符号化時に、コードブックに含まれるリーダが選択される確率が高まる。その結果、非特許文献1、および非特許文献3に開示されているボロノイ拡張技術を利用しなくてもよくなり、結果としてサブスペクトルの符号化に必要なビットが下がるため、本発明の効果をより高めることができる。
なお、本実施の形態では、近傍探索部303内で補正サブスペクトルが変換された結果、符号化するために必要なビット数が減るように、スペクトル補正部302において補正処理を行う場合について説明した。しかし、本発明はこれに限らず、近傍探索部303において、余剰ビット(リザーブビット)を利用することにより、さらに効果を高めることができる。例えば、補正サブスペクトルに対して、余剰ビットを使って振幅の正規化(ノーマライズ)をするという方法が例として挙げられる。具体的には、サブスペクトルのサブバンド幅が8である{ -16.4, 0.4, 1.6, 0.3, 4.4, 0.4, -1.6, -0.4 }というサブスペクトル(テストサブスペクトル)を符号化する場合を考える。この場合、スペクトル補正部302において、上記テストサブスペクトルに対して補正処理を行うことにより、テストサブスペクトルは補正テストサブスペクトル{ -16.4, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 }に補正される。この補正テストサブスペクトルは、近傍探索部303においては、{ 16, 0, 0, 0, 0, 0, 0, 0 }というベクトルに変換され、さらに{ 16, 0, 0, 0, 0, 0, 0, 0 }というリーダが選択される。このリーダはQ4に属するため、このリーダを符号化するためには、16ビットが必要となる。しかし、剰余ビットを使って補正後サブスペクトルをノーマライズし、{ 16, 0, 0, 0, 0, 0, 0, 0 }を{ 4, 0, 0, 0, 0, 0, 0, 0 }とすることにより、Q2に属するリーダを選択することができるため情報量を8ビット削減することができる(但し、剰余ビットを使って、「4で除算した」という情報を復号装置側に伝送する必要がある)。このように、剰余ビットを使って、グローバルゲインとは別のゲイン情報を符号化することにより、本発明の効果をより高めることができる。なおまた、上述したように、余剰ビットを補正サブスペクトルの正規化に用いる場合、全サブバンドではなく、一部のサブバンドに対して適用することにより、より効果が期待できる。例えば、相対的にエネルギの大きいサブバンドに対してのみ、上述した余剰ビットを適用し正規化することで、少ない余剰ビットで大きな品質改善効果を得ることができる。また、ここで、相対的にエネルギの大きいサブバンドの数はフレーム毎に異なっていても構わない。
なお、本実施の形態では、各サブスペクトルの符号化に必要なビット数を削減し、削減したビット数を他のサブバンドのサブスペクトルを符号化するために利用する構成について説明したが、本発明はこれに限らず、削減したビット数を他のサブバンドの符号化に利用しない構成についても同様に適用できる。この場合、復号品質の帯域感(帯域の広がり)は向上しないが、大きな品質劣化なしに、ビットレートを大幅に削減することができる。
また、本実施の形態では、符号化対象として、ベクトルで表されるスペクトルデータを代表的に用いて説明したが、必ずしもこれに限定されない。符号化対象として、ベクトルにより入力信号の特性を表現することが可能な異なるデータを用いても、本実施の形態と同様の作用効果が得られる。
また、本実施の形態に係る復号装置103は、上記符号化装置101から伝送された符号化情報を用いて処理を行うとした。しかし、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記符号化装置101からの符号化情報でなくても、復号装置103は処理を行うことが可能である。
また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
また、本実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、本実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2010年1月13日出願の特願2010−004978の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および符号化方法は、AVQ技術を用いて符号化を行う場合において、符号化対象とするベクトルに対して補正処理を施すことにより、非常に低いビットレートで、かつ低い処理演算量で、復号信号の品質を改善することができ、例えば、パケット通信システム、移動通信システムなどに好適である。
101 符号化装置
103 復号装置
201 直交変換処理部
202 AVQ符号化部
301 グローバルゲイン算出部
302 スペクトル補正部
303 近傍探索部
304 マルチレートインデキシング部
305 多重化部
401 AVQ復号部
402 直交変換処理部
501 マルチレート復号部

Claims (10)

  1. 入力信号を直交変換してスペクトルデータを形成する直交変換手段と、
    前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正手段と、
    前記補正処理されたスペクトルデータをラティスベクトルに変換する変換手段と、を備える、
    符号化装置。
  2. 前記スペクトル補正手段は、前記補正処理として、各サブバンドのスペクトルデータに関するサンプル群のうち、聴感的に重要なサンプル以外の値をゼロにする、
    請求項1記載の符号化装置。
  3. 前記スペクトル補正手段は、サブバンド毎にスペクトルデータの振幅の平均値を算出し、各サブバンドのスペクトルデータに関するサンプル群のうち、振幅が前記平均値以下のサンプルの値をゼロにする、
    請求項2記載の符号化装置。
  4. 前記スペクトル補正手段は、サブバンド毎にスペクトルデータの振幅の大きさを評価し、各サブバンドのスペクトルデータに関するサンプル群のうち、振幅の大きい方から予め定められた数のサンプルを選択し、当該選択されたサンプル以外のサンプルの値をゼロにする、
    請求項2記載の符号化装置。
  5. 前記スペクトル補正手段は、さらに、前記補正処理されたスペクトルデータを正規化する正規化手段を備える、
    請求項1記載の符号化装置。
  6. 前記正規化手段は、一部のサブバンドに対して正規化を行う、
    請求項5記載の符号化装置。
  7. 前記正規化手段によって正規化処理が行われるサブフレーム数は、フレーム毎に変化する、
    請求項6記載の符号化装置。
  8. 請求項1に記載の符号化装置を具備する通信端末装置。
  9. 請求項1に記載の符号化装置を具備する基地局装置。
  10. 入力信号を直交変換してスペクトルデータを形成するステップと、
    前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正ステップと、
    前記補正処理されたスペクトルデータをラティスベクトルに変換する変換ステップと、
    を具備する符号化方法。
JP2011549931A 2010-01-13 2011-01-12 符号化装置および符号化方法 Expired - Fee Related JP5606457B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011549931A JP5606457B2 (ja) 2010-01-13 2011-01-12 符号化装置および符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010004978 2010-01-13
JP2010004978 2010-01-13
JP2011549931A JP5606457B2 (ja) 2010-01-13 2011-01-12 符号化装置および符号化方法
PCT/JP2011/000096 WO2011086900A1 (ja) 2010-01-13 2011-01-12 符号化装置および符号化方法

Publications (2)

Publication Number Publication Date
JPWO2011086900A1 true JPWO2011086900A1 (ja) 2013-05-16
JP5606457B2 JP5606457B2 (ja) 2014-10-15

Family

ID=44304178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011549931A Expired - Fee Related JP5606457B2 (ja) 2010-01-13 2011-01-12 符号化装置および符号化方法

Country Status (4)

Country Link
US (1) US8924208B2 (ja)
EP (1) EP2525354B1 (ja)
JP (1) JP5606457B2 (ja)
WO (1) WO2011086900A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102959873A (zh) * 2010-07-05 2013-03-06 日本电信电话株式会社 编码方法、解码方法、装置、程序及记录介质
JP6400590B2 (ja) 2013-10-04 2018-10-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09230898A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法及び復号化方法
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
WO2009059333A1 (en) * 2007-11-04 2009-05-07 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP2001007704A (ja) 1999-06-24 2001-01-12 Matsushita Electric Ind Co Ltd トーン成分データの適応オーディオ符号化方法
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
CA2388358A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
EP1709743A1 (fr) * 2004-01-30 2006-10-11 France Telecom S.A. Quantification vectorielle en dimension et resolution variables
JP2006018023A (ja) 2004-07-01 2006-01-19 Fujitsu Ltd オーディオ信号符号化装置、および符号化プログラム
KR20080047443A (ko) * 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
US9009037B2 (en) 2009-10-14 2015-04-14 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and methods therefor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09230898A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法及び復号化方法
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
WO2009059333A1 (en) * 2007-11-04 2009-05-07 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
STEPHANE RAGOT, ET AL.: "Low-Complexity Multi-Rate Lattice Vector Quantization with Application to Wideband TCX Speech Coding", PROC. ICASSP '04, vol. Vol.I, JPN6014020620, 17 May 2004 (2004-05-17), CA, pages 501 - 504, ISSN: 0002815416 *

Also Published As

Publication number Publication date
US8924208B2 (en) 2014-12-30
EP2525354A4 (en) 2014-01-08
JP5606457B2 (ja) 2014-10-15
US20120296640A1 (en) 2012-11-22
EP2525354A1 (en) 2012-11-21
WO2011086900A1 (ja) 2011-07-21
EP2525354B1 (en) 2015-04-22

Similar Documents

Publication Publication Date Title
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5448850B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5511785B2 (ja) 符号化装置、復号装置およびこれらの方法
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
JP5419876B2 (ja) スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
ES2913760T3 (es) Codificador de voz y método de codificación de voz
US8898057B2 (en) Encoding apparatus, decoding apparatus and methods thereof
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
KR20070090217A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
EP3550563B1 (en) Encoder, decoder, encoding method, decoding method, and associated programs
JP5606457B2 (ja) 符号化装置および符号化方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
WO2013051210A1 (ja) 符号化装置及び符号化方法
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2012053146A1 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140826

R150 Certificate of patent or registration of utility model

Ref document number: 5606457

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees