JP5404418B2 - 符号化装置、復号装置および符号化方法 - Google Patents

符号化装置、復号装置および符号化方法 Download PDF

Info

Publication number
JP5404418B2
JP5404418B2 JP2009546944A JP2009546944A JP5404418B2 JP 5404418 B2 JP5404418 B2 JP 5404418B2 JP 2009546944 A JP2009546944 A JP 2009546944A JP 2009546944 A JP2009546944 A JP 2009546944A JP 5404418 B2 JP5404418 B2 JP 5404418B2
Authority
JP
Japan
Prior art keywords
encoding
gain
input signal
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009546944A
Other languages
English (en)
Other versions
JPWO2009081568A1 (ja
Inventor
智史 山梨
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009546944A priority Critical patent/JP5404418B2/ja
Publication of JPWO2009081568A1 publication Critical patent/JPWO2009081568A1/ja
Application granted granted Critical
Publication of JP5404418B2 publication Critical patent/JP5404418B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置および符号化方法に関する。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声/楽音信号を伝送する場合、音声/楽音信号(音楽信号)の伝送効率を高めるため、圧縮/符号化技術がよく使われる。また、近年では、単に低ビットレートで音声/楽音信号を符号化するという一方で、より広帯域の音声/楽音信号を符号化する技術に対するニーズが高まっている。
このようなニーズに対して、周波数帯域の広い信号を低ビットレートで符号化する技術がある(例えば、特許文献1参照)。これによれば、入力信号を低域部の信号と高域部の信号とに分け、高域部の信号のスペクトルを低域部の信号のスペクトルで置換することにより符号化して、全体のビットレートを低減させる。
特表2001−521648号公報
しかしながら、特許文献1に開示された帯域拡張技術においては、入力信号のスペクトルの低域部、あるいは復号スペクトルの低域部の調波構造を考慮していない。例えば、上記の帯域拡張技術においては、入力信号が楽音信号であるかまたは音声信号であるかを区別せずに帯域拡張処理を行う。しかし、一般的に楽音信号に比べ音声信号は、調波構造が弱く、スペクトル包絡の形状が複雑である場合が多い。このため、帯域拡張を行う際に、楽音信号のスペクトル包絡に割り当てたビット数と同様なビット数を、音声信号のスペクトル包絡に割り当てると、符号化の品質が劣化し、結果として復号信号の音質が劣化する可能性がある。また、逆に楽音信号のように入力信号の調波構造が非常に強い場合にも、調波構造を表すためには特に多くのビットを割り当てる必要がある。要するに、復号信号の音質を向上するためには、調波構造の強度に応じて帯域拡張の具体的な処理を切り替える必要がある。
図1は、スペクトル特性の大きく異なる2つの入力信号のスペクトル特性を示す図である。図1において、横軸は周波数を示し、縦軸はスペクトルの振幅を示す。図1Aは、周期性が非常に高いスペクトルを示し、一方、図1Bは、周期性が非常に低いスペクトルを示す。特許文献1には、高域スペクトルを生成するために低域スペクトルのどの帯域を利用するかの選択基準については詳しく言及されていないが、フレーム毎に高域スペクトルと最も類似する部分を低域スペクトルの中から探索する方法が最も一般的な手法と考えられる。この場合、従来手法では帯域拡張技術によって高域部分のスペクトルを生成する際、リファレンスとなる入力信号のスペクトルを区別せずに同一の方式(同一の類似探索方法、同一のスペクトル包絡量子化方法など)で帯域拡張処理を行う。しかし、図1Aのスペクトルは、図1Bのスペクトルに比べ周期性が非常に高いため、図1Aのスペクトルを利用して帯域拡張を行う際には、高域部のスペクトルの山谷の位置を適切に符号化しないと、復号信号の音質が大きく劣化してしまう。つまりこの場合は、高域スペクトルを生成するためにどの帯域の低域スペクトルを利用するかに対する情報量を大きくする必要がある。一方、図1Bのスペクトルを利用して帯域拡張を行う際には、スペクトルの調波構造はそれほど重要ではなく、復号信号の音質にも大きな影響を及ぼさない。従来は、このようなスペクトル特性が大きく異なる入力信号に対しても同一の方法で帯域を拡張するため
、十分に品質の高い復号信号を提供することが出来ないという問題点がある。
本発明の目的は、入力信号のスペクトルの低域部、あるいは復号スペクトルの低域部の調波構造を考慮して帯域拡張を行うことにより、帯域拡張による復号信号の品質の劣化を抑えることができる符号化装置、復号装置および符号化方法を提供することである。
本発明の符号化装置は、入力信号を符号化して第1符号化情報を生成する第1符号化手段と、前記第1符号化情報を復号して復号信号を生成する復号手段と、前記入力信号の調波構造の強度を分析し、分析結果を示す調波特性情報を生成する特性判定手段と、前記入力信号に対する前記復号信号の差分を符号化して第2符号化情報を生成するとともに、前記調波特性情報に基づいて、前記第2符号化情報を構成する複数のパラメータに割り当てるビット数を変更する第2符号化手段と、を具備する構成を採る。
本発明の復号装置は、符号化装置において入力信号を符号化して得られた第1符号化情報と、前記第1符号化情報を復号した復号信号と前記入力信号との差分を符号化して得られた第2符号化情報と、前記入力信号の調波構造の強度を分析した分析結果に基づき生成された調波特性情報と、を受信する受信手段と、前記第1符号化情報を用いて第1レイヤの復号を行い第1復号信号を得る第1復号手段と、前記第2符号化情報と前記第1復号信号とを用いて第2レイヤの復号を行い第2復号信号を得る第2復号手段と、を具備し、前記第2復号手段は、前記符号化装置において前記調波特性情報に基づいてビット数が割り当てられた、前記第2符号化情報を構成する複数のパラメータを用いて、前記第2レイヤの復号を行う構成を採る。
本発明の符号化方法は、入力信号を符号化して第1符号化情報を生成する第1符号化ステップと、前記第1符号化情報を復号して復号信号を生成する復号ステップと、前記入力信号の調波構造の強度を分析し、分析結果を示す調波特性情報を生成する特性判定ステップと、前記入力信号に対する前記復号信号の差分を符号化して第2符号化情報を生成するとともに、前記調波特性情報に基づいて、前記第2符号化情報を構成する複数のパラメータに割り当てるビット数を変更する第2符号化ステップと、を具備するようにした。
本発明によれば、調波構造が大きく異なる様々な入力信号に対して品質の良い復号信号を得ることができる。
本発明について、その概略の一例を挙げると、入力信号の高域部と、復号信号のスペクトルの低域部または入力信号の低域部の何れかとの調波構造の差異を考慮し、この差異が予め設定されたレベル以上である場合には、広帯域信号の低域部のスペクトルデータに基づいて高域部のスペクトルデータを符号化する方法(帯域拡張方法)を切り替えることにより、調波構造が大きく異なる様々な入力信号に対して品質の良い復号信号を得ることができるというものである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。
(実施の形態1)
図2は、本発明の実施の形態1に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図2において、通信システムは、符号化装置と復号装置とを備え、それぞれ伝送路を介して通信可能な状態となっている。
符号化装置101は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をx(n=0、…、N−1)と表すこととする。nは、Nサンプルずつ区切られた入力信号のうち、信号要素のn+1番目であることを示す。符号化された入力情報(符号化情報)は伝送路102を介して復号装置103に符号化情報を送信する。
復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、これを復号し出力信号を得る。
図3は、図2に示した符号化装置101の内部の主要な構成を示すブロック図である。
入力信号のサンプリング周波数をSRinputとすると、ダウンサンプリング処理部201は、入力信号のサンプリング周波数をSRinputからSRbaseまでダウンサンプリングし(SRbase<SRinput)、ダウンサンプリングした入力信号をダウンサンプリング後入力信号として、第1レイヤ符号化部202に出力する。
第1レイヤ符号化部202は、ダウンサンプリング処理部201から入力されるダウンサンプリング後入力信号に対して、例えばCELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って第1レイヤ符号化情報を生成する。第1レイヤ符号化部202は、生成した第1レイヤ符号化情報を第1レイヤ復号部203および符号化情報統合部208に出力し、第1レイヤ符号化情報に含まれる量子化適応音源利得を特性判定部206に出力する。
第1レイヤ復号部203は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報に対して、例えばCELP方式のタイプの音声復号方法を用いて復号を行って第1
レイヤ復号信号を生成し、生成した第1レイヤ復号信号をアップサンプリング処理部204に出力する。なお、第1レイヤ復号部203の詳細については後述する。
アップサンプリング処理部204は、第1レイヤ復号部203から入力される第1レイヤ復号信号のサンプリング周波数をSRbaseからSRinputまでアップサンプリングし、アップサンプリングした第1レイヤ復号信号をアップサンプリング後第1レイヤ復号信号として、直交変換処理部205に出力する。
直交変換処理部205は、バッファbuf1、およびbuf2(n=0、…、N−1)を内部に有し、入力信号x、およびアップサンプリング処理部204から入力されるアップサンプリング後第1レイヤ復号信号yを修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)する。
次に、直交変換処理部205における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
まず、直交変換処理部205は、下記の式(1)および式(2)によりバッファbuf1、およびbuf2それぞれを、「0」を初期値として初期化する。
Figure 0005404418
Figure 0005404418
次いで、直交変換処理部205は、入力信号x、アップサンプリング後第1レイヤ復号信号yに対し下記の式(3)および式(4)に従ってMDCTし、入力信号のMDCT係数(以下、入力スペクトルと呼ぶ)S2(k)、およびアップサンプリング後第1レイヤ復号信号ynのMDCT係数(以下、第1レイヤ復号スペクトルと呼ぶ)S1(k)を求める。
Figure 0005404418
Figure 0005404418
ここで、kは1フレームにおける各サンプルのインデックスを示す。直交変換処理部205は、入力信号xとバッファbuf1とを結合させたベクトルであるx'を下記の式(5)により求める。また、直交変換処理部205は、アップサンプリング後第1レイヤ復号信号yとバッファbuf2とを結合させたベクトルであるy'を下記の式(6)により求める。
Figure 0005404418
Figure 0005404418
次に、直交変換処理部205は、式(7)および式(8)によりバッファbuf1およびbuf2を更新する。
Figure 0005404418
Figure 0005404418
そして、直交変換処理部205は、入力スペクトルS2(k)および第1レイヤ復号スペクトルS1(k)を第2レイヤ符号化部207に出力する。
特性判定部206は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報に含まれる量子化適応音源利得の値に応じて特性情報を生成し、第2レイヤ符号化部207に出力する。なお、特性判定部206の詳細については後述する。
第2レイヤ符号化部207は、特性判定部206から入力される特性情報に基づき、直交変換処理部205から入力される入力スペクトルS2(k)および第1レイヤ復号スペクトルS1(k)を用いて第2レイヤ符号化情報を生成し、生成した第2レイヤ符号化情報を符号化情報統合部208に出力する。なお、第2レイヤ符号化部207の詳細については後述する。
符号化情報統合部208は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報と、第2レイヤ符号化部207から入力される第2レイヤ符号化情報とを統合し、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
図4は、第1レイヤ符号化部202の内部の主要な構成を示すブロック図である。
図4において、前処理部301は、入力信号に対し、DC成分を取り除くハイパスフィルタ処理、後続する符号化処理の性能改善を図る波形整形処理又はプリエンファシス処理を行い、これらの処理を施して得られた信号XinをLPC(Linear Prediction Coefficients)分析部302および加算部305に出力する。
LPC分析部302は、前処理部301から入力されるXinを用いて線形予測分析を行い、分析結果(線形予測係数)をLPC量子化部303に出力する。
LPC量子化部303は、LPC分析部302から入力される線形予測係数(LPC)の量子化処理を行い、量子化LPCを合成フィルタ304に出力すると共に、量子化LPCを表す符号(L)を多重化部314に出力する。
合成フィルタ304は、LPC量子化部303から入力される量子化LPCに基づくフィルタ係数により、後述する加算部311から入力される駆動音源に対してフィルタ合成を行って合成信号を生成し、合成信号を加算部305に出力する。
加算部305は、合成フィルタ304から入力される合成信号の極性を反転させて、極性を反転させた合成信号を前処理部301から入力されるXinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部312に出力する。
適応音源符号帳306は、過去に加算部311によって出力された駆動音源をバッファに記憶しており、後述するパラメータ決定部313から入力される信号により特定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして切り出して、乗算部309に出力する。
量子化利得生成部307は、パラメータ決定部313から入力される信号によって特定される量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算部309および乗算部310に出力する。
固定音源符号帳308は、パラメータ決定部313から入力される信号によって特定される形状を有するパルス音源ベクトルを固定音源ベクトルとして乗算部310に出力する。なお、パルス音源ベクトルに拡散ベクトルを乗算して得られたものを固定音源ベクトルとして乗算部310に出力しても良い。
乗算部309は、量子化利得生成部307から入力される量子化適応音源利得を、適応音源符号帳306から入力される適応音源ベクトルに乗じて、加算部311に出力する。また、乗算部310は、量子化利得生成部307から入力される量子化固定音源利得を、固定音源符号帳308から入力される固定音源ベクトルに乗じて、加算部311に出力する。
加算部311は、乗算部309から入力される利得乗算後の適応音源ベクトルと、乗算部310から入力される利得乗算後の固定音源ベクトルとをベクトル加算し、加算結果である駆動音源を合成フィルタ304および適応音源符号帳306に出力する。なお、適応音源符号帳306に出力された駆動音源は、適応音源符号帳306のバッファに記憶される。
聴覚重み付け部312は、加算部305から入力される誤差信号に対して聴覚的な重み付けを行って符号化歪みとしてパラメータ決定部313に出力する。
パラメータ決定部313は、聴覚重み付け部312から入力される符号化歪みを最小とする適応音源ベクトル、固定音源ベクトルおよび量子化利得を、適応音源符号帳306、固定音源符号帳308および量子化利得生成部307からそれぞれ選択し、選択結果を示す適応音源ベクトル符号(A)、固定音源ベクトル符号(F)および量子化利得符号(G)を多重化部314に出力する。また、パラメータ決定部313は、多重化部314に出力する量子化利得符号(G)に含まれる量子化適応音源利得(G_A)を特性判定部206に出力する。
多重化部314は、LPC量子化部303から入力される量子化LPCを表す符号(L)、パラメータ決定部313から入力される適応音源ベクトル符号(A)、固定音源ベクトル符号(F)および量子化利得符号(G)を多重化して第1レイヤ符号化情報として、第1レイヤ復号部203に出力する。
図5は、第1レイヤ復号部203の内部の主要な構成を示すブロック図である。
図5において、多重化分離部401は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報を個々の符号(L)、(A)、(G)、(F)に分離する。分離されたLPC符号(L)はLPC復号部402に出力され、分離された適応音源ベクトル符号(A)は適応音源符号帳403に出力され、分離された量子化利得符号(G)は量子化利得生成部404に出力され、分離された固定音源ベクトル符号(F)は固定音源符号帳405に出力される。
LPC復号部402は、多重化分離部401から入力される符号(L)から量子化LPCを復号し、復号した量子化LPCを合成フィルタ409に出力する。
適応音源符号帳403は、多重化分離部401から入力される適応音源ベクトル符号(A)で指定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部406に出力する。
量子化利得生成部404は、多重化分離部401から入力される量子化利得符号(G)で指定される量子化適応音源利得と量子化固定音源利得とを復号し、量子化適応音源利得を乗算部406に出力し、量子化固定音源利得を乗算部407に出力する。
固定音源符号帳405は、多重化分離部401から入力される固定音源ベクトル符号(F)で指定される固定音源ベクトルを生成し、乗算部407に出力する。
乗算部406は、適応音源符号帳403から入力される適応音源ベクトルに量子化利得生成部404から入力される量子化適応音源利得を乗算して、加算部408に出力する。また、乗算部407は、固定音源符号帳405から入力される固定音源ベクトルに量子化利得生成部404から入力される量子化固定音源利得を乗算して、加算部408に出力する。
加算部408は、乗算部406から入力される利得乗算後の適応音源ベクトルと、乗算部407から入力される利得乗算後の固定音源ベクトルとを加算して駆動音源を生成し、駆動音源を合成フィルタ409および適応音源符号帳403に出力する。
合成フィルタ409は、LPC復号部402によって復号されたフィルタ係数を用いて、加算部408から入力される駆動音源のフィルタ合成を行い、合成した信号を後処理部410に出力する。
後処理部410は、合成フィルタ409から入力される信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、第1レイヤ復号信号としてアップサンプリング処理部204に出力する。
図6は、特性判定部206において特性情報を生成する処理の手順を示すフロー図である。なお、以下の説明ではステップを「ST」と記す。
まず、特性判定部206は、第1レイヤ符号化部202のパラメータ決定部313から量子化適応音源利得G_Aが入力される(ST1010)。次いで、特性判定部206は、量子化適応音源利得G_Aが閾値THより小さいか否かを判定する(ST1020)。ST1020において、G_AがTHより小さいと判定した場合(ST1020:「YE
S」)には、特性判定部206は、特性情報の値を「0」に設定する(ST1030)。一方、ST1020において、G_AがTH以上であると判定した場合(ST1020:「NO」)には、特性判定部206は、特性情報の値を「1」に設定する(ST1040)。このように、特性情報は、「1」という値を用いて、入力スペクトルの調波構造の強度が予め定められたレベル以上であることを表し、「0」という値を用いて、入力スペクトルの調波構造の強度が予め定められたレベルより低いことを表す。次いで、特性判定部206は、特性情報を第2レイヤ符号化部207に出力する(ST1050)。
ここで、調波構造の強度とは、スペクトルの周期性および振幅の変動(山谷の大きさ)を表すパラメータであり、例えば周期性がはっきりするほど、また振幅の変動が大きいほど、調波構造が強いと言う。
図7は、第2レイヤ符号化部207の内部の主要な構成を示すブロック図である。
第2レイヤ符号化部207は、フィルタ状態設定部501、フィルタリング部502、探索部503、ピッチ係数設定部504、ゲイン符号化部505、および多重化部506を備え、各部は以下の動作を行う。
フィルタ状態設定部501は、直交変換処理部205から入力される第1レイヤ復号スペクトルS1(k)[0≦k<FL]を、フィルタリング部502で用いるフィルタ状態として設定する。フィルタリング部502における全周波数帯域0≦k<FHのスペクトルS(k)の0≦k<FLの帯域に、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態(フィルタ状態)として格納される。
フィルタリング部502は、マルチタップ(タップ数が1より多い)のピッチフィルタを備え、フィルタ状態設定部501により設定されたフィルタ状態と、ピッチ係数設定部504から入力されるピッチ係数に基づいて、第1レイヤ復号スペクトルをフィルタリングし、入力スペクトルの推定値S2’(k)(FL≦k<FH)(以下、推定スペクトルと称す)を算出する。フィルタリング部502は、推定スペクトルS2’(k)を探索部503に出力する。なお、フィルタリング部502におけるフィルタリング処理の詳細については後述する。
探索部503は、直交変換処理部205から入力される入力スペクトルS2(k)の高域部(FL≦k<FH)と、フィルタリング部502から入力される推定スペクトルS2’(k)との類似度を算出する。この類似度の算出は、例えば相関演算等により行われる。フィルタリング部502、探索部503、およびピッチ係数設定部504の処理は閉ループを構成する。この閉ループにおいて、探索部503は、ピッチ係数設定部504からフィルタリング部502に入力されるピッチ係数Tを種々に変化させることにより、各ピッチ係数に対応する類似度を算出する。そのうち類似度が最大となるピッチ係数、すなわち最適ピッチ係数T’を多重化部506に出力する。また、探索部503は、最適ピッチ係数T’に対応する推定スペクトルS2’(k)をゲイン符号化部505に出力する。
ピッチ係数設定部504は、特性判定部206から入力される特性情報に基づき最適ピッチ係数T’の探索範囲を切り替える。そして、ピッチ係数設定部504は、探索部503の制御の下、ピッチ係数Tを探索範囲の中で少しずつ変化させながら、フィルタリング部502に順次出力する。例えば、ピッチ係数設定部504は、特性情報の値が「0」である場合には、Tmin〜Tmax0を探索範囲とし、特性情報の値が「1」である場合には、Tmin〜Tmax1を探索範囲とする。ここでは、Tmax0<Tmax1とする。すなわち、特性情報の値が「1」である場合には、ピッチ係数設定部504は、最適ピッチ係数T’の探索範囲をより大きい探索範囲に切り替えることにより、ピッチ係数T
に割り当てるビット数を増加させる。また、特性情報の値が「0」である場合には、ピッチ係数設定部504は、最適ピッチ係数T’の探索範囲をより小さい探索範囲に切り替えることにより、ピッチ係数Tに割り当てるビット数を減少させる。
ゲイン符号化部505は、特性判定部206から入力される特性情報に基づき、直交変換処理部205から入力される入力スペクトルS2(k)の高域部(FL≦k<FH)についてのゲイン情報を算出する。具体的には、ゲイン符号化部505は、周波数帯域FL≦k<FHをJ個のサブバンドに分割し、入力スペクトルS2(k)のサブバンド毎のスペクトルパワを求める。この場合、第jサブバンドのスペクトルパワB(j)は下記の式(9)で表される。
Figure 0005404418
式(9)において、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。また、ゲイン符号化部505は、同様に、探索部503から入力される推定スペクトルS2’(k)のサブバンド毎のスペクトルパワB’(j)を下記の式(10)に従い算出する。次いで、ゲイン符号化部505は、入力スペクトルS2(k)に対する推定スペクトルのサブバンド毎の変動量V(j)を式(11)に従い算出する。
Figure 0005404418
Figure 0005404418
そして、ゲイン符号化部505は、特性情報の値に応じて変動量V(j)の符号化に用いるコードブックを切り替え、変動量V(j)を符号化し、符号化後の変動量V(j)に対応するインデックスを多重化部506に出力する。ゲイン符号化部505は、特性情報の値が「0」である場合には、コードブックサイズがSize0のコードブックに切り替え、特性情報の値が「1」である場合には、コードブックサイズがSize1のコードブックに切り替え、変動量V(j)の符号化を行う。ここで、Size1<Size0とする。すなわち、ゲイン符号化部505は、特性情報の値が「0」である場合には、ゲインの変動量V(j)の符号化に利用するコードブックをより大きいサイズ(コードベクトルのエントリ数)のコードブックに切り替えることにより、ゲインの変動量V(j)の符号化に割り当てるビット数を増加させる。また、ゲイン符号化部505は、特性情報の値が「1」である場合には、ゲインの変動量V(j)の符号化に利用するコードブックをより小さいサイズのコードブックに切り替えることにより、ゲインの変動量V(j)の符号化に割り当てるビット数を減少させる。なお、ゲイン符号化部505においてゲインの変動量V(j)に割り当てるビット数の変化量を、ピッチ係数設定部504においてピッチ係数Tに割り当てるビット数の変化量と同様にすれば、第2レイヤ符号化部207における符号化に用いるビット数を一定にすることができる。例えば、特性情報の値が「0」である場合には、ゲイン符号化部505においてゲインの変動量V(j)に割り当てるビット数の増加量を、ピッチ係数設定部504においてピッチ係数Tに割り当てるビット数の減少量と同様にすれば良い。
多重化部506は、探索部503から入力される最適ピッチ係数T’と、ゲイン符号化部505から入力される変動量V(j)のインデックスと、特性判定部206から入力される特性情報と、を第2レイヤ符号化情報として多重化し、符号化情報統合部208に出力する。なお、T’、V(j)、特性情報を直接、符号化情報統合部208に入力して、符号化情報統合部208にて第1レイヤ符号化情報と多重化しても良い。
次いで、フィルタリング部502におけるフィルタリング処理の詳細について、図8を用いて説明する。
フィルタリング部502は、ピッチ係数設定部504から入力されるピッチ係数Tを用いて、帯域FL≦k<FHのスペクトルを生成する。フィルタリング部502の伝達関数は下記の式(12)で表される。
Figure 0005404418
式(12)において、Tはピッチ係数設定部504から与えられるピッチ係数、βは予め内部に記憶されているフィルタ係数を表している。例えば、タップ数が3の場合、フィルタ係数の候補は(β−1、β、β)=(0.1、0.8、0.1)が例として挙げられる。この他に(β−1、β、β)=(0.2、0.6、0.2)、(0.3、0.4、0.3)などの値も適当である。また、式(12)においてM=1とする。Mはタップ数に関する指標である。
フィルタリング部502における全周波数帯域のスペクトルS(k)の0≦k<FLの帯域には、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態(フィルタ状態)として格納される。
S(k)のFL≦k<FHの帯域には、以下の手順のフィルタリング処理により、推定スペクトルS2’(k)が格納される。すなわち、S2’(k)には、基本的に、このkよりTだけ低い周波数のスペクトルS(k−T)が代入される。ただし、スペクトルの円滑性を増すために、実際には、スペクトルS(k−T)からiだけ離れた近傍のスペクトルS(k−T+i)にフィルタ係数βを乗じたスペクトルβ・S(k−T+i)を、全てのiについて加算したスペクトルをS2’(k)に代入する。この処理は下記の式(13)で表される。
Figure 0005404418
上記演算を、周波数の低いk=FLから順に、kをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける推定スペクトルS2’(k)を算出する。
以上のフィルタリング処理は、ピッチ係数設定部504からピッチ係数Tが与えられる度に、FL≦k<FHの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部503に出力される。
次いで、探索部503において最適ピッチ係数T’を探索する処理の手順について、図9を用いて説明する。図9は、探索部503において最適ピッチ係数T’を探索する処理
の手順を示すフロー図である。
まず、探索部503は、類似度の最小値を保存するための変数である最小類似度Dminを[+∞]に初期化する(ST4010)。次いで、探索部503は、下記の式(14)に従い、あるピッチ係数における入力スペクトルS2(k)の高域部(FL≦k<FH)と、推定スペクトルS2’(k)との類似度Dを算出する(ST4020)。
Figure 0005404418
式(14)において、M’は、類似度Dを算出する際のサンプル数を示し、高域部のサンプル長(FH−FL+1)以下の任意の値で良い。
なお、上述したように、フィルタリング部502において生成される推定スペクトルは、第1レイヤ復号スペクトルをフィルタリングして得られるスペクトルである。従って、探索部503において算出される入力スペクトルS2(k)の高域部(FL≦k<FH)と、推定スペクトルS2’(k)との類似度は、入力スペクトルS2(k)の高域部(FL≦k<FH)と、第1レイヤ復号スペクトルとの類似度を表すことにもなる。
次いで、探索部503は、算出した類似度Dが最小類似度Dminより小さいか否かを判定する(ST4030)。ST4020において算出された類似度が最小類似度Dminより小さい場合(ST4030:「YES」)には、探索部503は、類似度Dを最小類似度Dminに代入する(ST4040)。一方、ST4020において算出された類似度が最小類似度Dmin以上である場合(ST4030:「NO」)には、探索部503は、探索範囲が終了したか否かを判定する。すなわち、探索部503は、探索範囲内のすべてのピッチ係数それぞれに対し、ST4020において上記の式(14)に従って類似度を算出したか否かを判定する(ST4050)。探索範囲が終了しなかった場合(ST4050:「NO」)には、探索部503は処理を再びST4020に戻す。そして、探索部503は、前回ST4020の手順において式(14)に従って類似度を算出した場合とは異なるピッチ係数に対して、式(14)に従い類似度を算出する。一方、探索範囲が終了した場合(ST4050:「YES」)には、探索部503は、最小類似度Dminに対応するピッチ係数Tを最適ピッチ係数T’として多重化部506に出力する(ST4060)。
次いで、図2に示した復号装置103について説明する。
図10は、復号装置103の内部の主要な構成を示すブロック図である。
図10において、符号化情報分離部601は、入力された符号化情報の中から第1レイヤ符号化情報と第2レイヤ符号化情報とを分離し、分離した第1レイヤ符号化情報を第1レイヤ復号部602に出力し、分離した第2レイヤ符号化情報を第2レイヤ復号部605に出力する。
第1レイヤ復号部602は、符号化情報分離部601から入力される第1レイヤ符号化情報に対して復号を行い、生成された第1レイヤ復号信号をアップサンプリング処理部603に出力する。ここで、第1レイヤ復号部602の構成および動作は、図3に示した第1レイヤ復号部203と同様であるため、詳細な説明は省略する。
アップサンプリング処理部603は、第1レイヤ復号部602から入力される第1レイヤ復号信号に対してサンプリング周波数をSRbaseからSRinputまでアップサンプリングする処理を行い、アップサンプリングする処理により得られるアップサンプリング後第1レイヤ復号信号を直交変換処理部604に出力する。
直交変換処理部604は、アップサンプリング処理部603から入力されるアップサンプリング後第1レイヤ復号信号に対して直交変換処理(MDCT)を施し、得られるアップサンプリング後第1レイヤ復号信号のMDCT係数(以下、第1レイヤ復号スペクトルと呼ぶ)S1(k)を第2レイヤ復号部605に出力する。ここで、直交変換処理部604の構成および動作は、図3に示した直交変換処理部205と同様であるため、詳細な説明は省略する。
第2レイヤ復号部605は、直交変換処理部604から入力される第1レイヤ復号スペクトルS1(k)、および符号化情報分離部601から入力される第2レイヤ符号化情報から、高域成分を含む第2レイヤ復号信号を生成し、これを出力信号として出力する。
図11は、図10に示した第2レイヤ復号部605の内部の主要な構成を示すブロック図である。
図11において、分離部701は、符号化情報分離部601から入力される第2レイヤ符号化情報を、フィルタリングに関する情報である最適ピッチ係数T’と、ゲインに関する情報である符号化後変動量V(j)のインデックスと、調波構造に関する情報である特性情報と、に分離し、最適ピッチ係数T’をフィルタリング部703に出力し、符号化後変動量V(j)のインデックスと、特性情報とをゲイン復号部704に出力する。なお、符号化情報分離部601において、最適ピッチ係数T’、符号化後変動量V(j)のインデックス、特性情報を分離済みの場合は、分離部701を配置しなくても良い。
フィルタ状態設定部702は、直交変換処理部604から入力される第1レイヤ復号スペクトルS1(k)[0≦k<FL]を、フィルタリング部703で用いるフィルタ状態として設定する。ここで、フィルタリング部703における全周波数帯域0≦k<FHのスペクトルを便宜的にS(k)と呼ぶ場合、S(k)の0≦k<FLの帯域に、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態(フィルタ状態)として格納される。ここで、フィルタ状態設定部702の構成および動作は、図7に示したフィルタ状態設定部501と同様であるため、詳細な説明は省略する。
フィルタリング部703は、マルチタップ(タップ数が1より多い)のピッチフィルタを備える。フィルタリング部703は、フィルタ状態設定部702により設定されたフィルタ状態と、分離部701から入力される最適ピッチ係数T’と、予め内部に格納しているフィルタ係数とに基づき、第1レイヤ復号スペクトルS1(k)をフィルタリングし、上記の式(13)に示す、入力スペクトルS2(k)の推定スペクトルS2’(k)を算出する。フィルタリング部703でも、上記の式(12)に示したフィルタ関数が用いられる。
ゲイン復号部704は、分離部701から入力される特性情報を用いて、符号化後変動量V(j)のインデックスを復号し、変動量V(j)の量子化値である変動量V(j)を求める。ここで、ゲイン復号部704は、特性情報の値に応じて、符号化後変動量V(j)のインデックスの復号に用いるコードブックを切り替える。ゲイン復号部704におけるコードブックの切り替え方法は、ゲイン符号化部505におけるコードブックの切り替え方法と同様である。すなわち、ゲイン復号部704は、特性情報の値が「0」である場合には、コードブックサイズがSize0のコードブックに切り替え、特性情報の値が「1
」である場合には、コードブックサイズがSize1のコードブックに切り替える。ここでも、Size1<Size0とする。
スペクトル調整部705は、下記の式(15)に従い、フィルタリング部703から入力される推定スペクトルS2’(k)に、ゲイン復号部704から入力されるサブバンド毎の変動量V(j)を乗じる。これにより、スペクトル調整部705は、推定スペクトルS2’(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、第2レイヤ復号スペクトルS3(k)を生成して直交変換処理部706に出力する。
Figure 0005404418
ここで、第2レイヤ復号スペクトルS3(k)の低域部(0≦k<FL)は第1レイヤ復号スペクトルS1(k)からなり、第2レイヤ復号スペクトルS3(k)の高域部(FL≦k<FH)はスペクトル形状調整後の推定スペクトルS2’(k)からなる。
直交変換処理部706は、スペクトル調整部705から入力される第2レイヤ復号スペクトルS3(k)を時間領域の信号に変換し、得られる第2レイヤ復号信号を出力信号として出力する。ここでは、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
以下、直交変換処理部706における具体的な処理について説明する。
直交変換処理部706は、バッファbuf’(k)を内部に有しており、下記の式(16)に示すようにバッファbuf’(k)を初期化する。
Figure 0005404418
また、直交変換処理部706は、スペクトル調整部705から入力される第2レイヤ復号スペクトルS3(k)を用いて下記の式(17)に従い、第2レイヤ復号信号y”を求めて出力する。
Figure 0005404418
式(17)において、Z5(k)は、下記の式(18)に示すように、復号スペクトルS3(k)とバッファbuf’(k)とを結合させたベクトルである。
Figure 0005404418
次に、直交変換処理部706は、下記の式(19)に従いバッファbuf’(k)を更新する。
Figure 0005404418
次に、直交変換処理部706は、復号信号y”を出力信号として出力する。
このように、本実施の形態によれば、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する符号化/復号において、符号化装置は量子化適応音源利得を用いて入力スペクトルの調波構造の強度を分析し、その分析結果に応じて符号化パラメータ間のビットアロケーションを適切に変更するため、復号装置で得られる復号信号の音質を向上することができる。
具体的には、本実施の形態に係る符号化装置は、量子化適応音源利得が閾値以上である場合には、入力スペクトルの調波構造が比較的強いと判断し、閾値未満である場合には、入力スペクトルの調波構造が比較的弱いと判断する。そして、前者の場合においては、帯域拡張のフィルタリングに用いる最適ピッチ係数を探索するためのビット数を増加させる代わりに、ゲインに関する情報を符号化するためのビット数を減少させる。また、後者の場合においては、帯域拡張のフィルタリングに用いる最適ピッチ係数を探索するためのビット数を減少させる代わりに、ゲインに関する情報を符号化するためのビット数を増加させる。これにより、入力スペクトルの調波構造に応じた適切なビットアロケーションで符号化を行うことができ、復号装置において復号信号の音質を向上することができる。
なお、本実施の形態では、特性判定部206は、量子化適応音源利得を利用して特性情報を生成する場合を例にとって説明した。ただし、本発明はこれに限定されず、特性判定部206は、第1レイヤ符号化情報に含まれるその他のパラメータ、例えば適応音源ベクトルを利用して特性情報を決定しても良い。また、特性情報の決定に利用するパラメータの数は1つに限らず、複数あるいは第1レイヤ符号化情報に含まれる全てであっても良い。
また、本実施の形態では、特性判定部206は、第1レイヤ符号化情報に含まれる量子化適応音源利得を利用して特性情報を生成する場合を例にとって説明した。ただし、本発明はこれに限定されず、特性判定部206は、直接、入力スペクトルの調波構造の強度を分析し特性情報を生成しても良い。入力スペクトルの調波構造の強度の分析方法としては、例えば入力信号のフレーム毎のエネルギ変化量を算出する方法などが挙げられる。以下、図12および図13を用いてこのような方法について説明する。図12は、エネルギ変化量により特性情報を生成する符号化装置111の内部の主要な構成を示すブロックである。符号化装置111は、特性判定部206の代わりに特性判定部216を備える点において図3に示した符号化装置101と相違する。図12において、特性判定部216には直接、入力信号が入力される。図13は、特性判定部216において特性情報を生成する処理の手順を示すフロー図である。まず、特性判定部216は、入力信号の現フレームのエネルギE_curを算出する(ST2010)。次いで、特性判定部216は、現フレームのエネルギE_curと1つ前のフレームのエネルギE_Preとの差の絶対値|E_cur−E_Pre|が閾値TH以上であるか否かを判定する(ST2020)。特性判定部216は、|E_cur−E_Pre|がTH以上である場合(ST2020:「YES」)には、特性情報の値を「0」に設定し(ST2030)、|E_cur−E_Pre|がTH未満である場合(ST2020:「NO」)には、特性情報の値を「1」に設定する(ST2040)。次いで、特性判定部216は、特性情報を第2レイヤ符号化部207に出力し(ST2050)、現フレームのエネルギE_curを用いて1つ前のフレームのエネルギE_Preを更新する(ST2060)。なお、特性判定部216は、過去の数フレームそれぞれにおけるエネルギを記憶しており、過去のフレームに対する現フレームのエネルギの変動量の算出に用いても良い。
また、本実施の形態では、第2レイヤ符号化部207中のピッチ係数設定部504において、設定するピッチ係数の範囲の大きさ(エントリ数)を変更するとともに、ゲイン符
号化部505において符号化時のコードブックサイズのサイズ(エントリ数)を変更することにより、入力信号の特性に対応してビットアロケーションを変更する場合について説明した。ただし、本発明はこれに限定されず、単純なピッチ係数の範囲の大きさやコードブックサイズの変更以外の方法で符号化処理を切り替える場合についても同様に適用できる。例えば、ピッチ係数の設定方法については、単純にピッチ係数の設定範囲を「Tmin〜Tmax0」及び「Tmin〜Tmax1」のいずれかに切り替えるのではなく、非連続的に切り替えることもできる。つまり、特性情報の値が「0」の場合は、「Tmin〜Tmax0(エントリ数はTmax0−Tmin)」を探索するが、特性情報の値が「1」の場合は、「Tmin〜Tmax2の範囲でk個おき(エントリ数はTmax1−Tmin)」という条件で探索を行うことも可能である。なお、エントリ数については前述した条件で行う。このように、単純にピッチ係数のエントリ数を連続的に変化させるだけでなく、エントリ数が(Tmax1−Tmin)という条件で非連続的にピッチ係数を変化させることで、より入力信号の特性に応じたピッチ係数の設定方法を採ることが可能である。この切替方法は、本実施の形態で説明した切替方法に比べ、入力信号の低域部の広範囲に渡って類似探索を行うことが可能になるため、入力信号のスペクトル特性が、低域全体で大きく異なっている場合に特に有効である。
また、コードブックサイズについては、単純にコードブックサイズがSize0であるコードブックとSize1であるコードブックとを切り替えるという方法だけではなく、符号化するゲインの構成自体を変化させることもできる。例えば、ゲイン符号化部505は、特性情報の値が「0」の場合は、周波数帯域FL≦k<FHをJ個のサブバンドではなくK個のサブバンド(K>J)に分割し、各サブバンドのゲインの変動量を符号化することもできる。ここでは、K個のサブバンドのゲインの変動量を、前述したコードブックサイズがSize0である場合に必要とする情報量で符号化するものとする。このように、単純にゲインの変動量を符号化する時のコードブックサイズを変更するのではなく、サブバンドのバンド幅を減らし、サブバンド数を増やした条件でゲインの変動量を符号化することにより、より入力信号の特性に応じたゲインの符号化をすることが可能である。この方法は、高域のゲインのサブバンド数を変更することで、周波数軸上でのゲインの分解能を向上させることができ、入力信号の高域のスペクトルのパワーが周波数軸上で大きく変動している場合に特に有効である。
(実施の形態2)
本発明の実施の形態1では、時間領域の信号または符号化情報を用いて特性情報を生成する場合を例にとって説明した。これに対し、本発明の実施の形態2では、入力信号を周波数領域に変換し、調波構造の強度を分析して特性情報を生成する場合について、図14及び図15を用いて説明する。
本実施の形態に係る通信システムは、本発明の実施の形態1に係る通信システムと同様であり、符号化装置101の代わりに符号化装置121を備える点のみにおいて相違する。
図14は、本発明の実施の形態2に係る符号化装置121の内部の主要な構成を示すブロック図である。なお、図14に示す符号化装置121は、図3に示した符号化装置101と基本的に同様であり、特性判定部206の代わりに特性判定部226を備える点のみが相違する。
特性判定部226は、直交変換処理部205から入力される入力スペクトルの調波構造の強度を分析し、この分析結果に基づき特性情報を生成して第2レイヤ符号化部207に出力する。なお、ここでは、入力スペクトルの調波構造としてスペクトルフラットネスメジャー(SFM:Spectral Flatness Measure)を用いる場合を例にとって説明する。S
FMは、振幅スペクトルの幾何平均と算術平均との比(=幾何平均/算術平均)で表される。スペクトルのピーク性が強いほどSFMは0.0に近づき、スペクトルの雑音性が強いほどSFMは1.0に近づく。特性判定部226は、入力信号スペクトルのSFMを算出し、下記の式(20)のように予め定められた閾値SFMthと比較して特性情報Hを生成する。
Figure 0005404418
図15は、特性判定部226において特性情報を生成する処理の手順を示すフロー図である。
まず、特性判定部226は、入力スペクトルの調波構造の強度の分析結果としてSFMを算出する(ST3010)。次いで、特性判定部226は、入力スペクトルのSFMが閾値SFMth以上であるか否かを判定する(ST3020)。入力スペクトルのSFMがSFMth以上である場合(ST3020:「YES」)には、特性情報Hの値を「0」に設定し(ST3030)、入力スペクトルのSFMがSFMth未満である場合(ST3020:「NO」)には、特性情報Hの値を「1」に設定する(ST3040)。次いで、特性判定部226は、特性情報を第2レイヤ符号化部207に出力する(ST3050)。
このように、本実施の形態によれば、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する符号化/復号において、符号化装置は入力信号を周波数領域に変換して得られる入力スペクトルの調波構造の強度を分析し、その分析結果に応じて符号化パラメータ間のビットアロケーションを変更する。このため、復号装置で得られる復号信号の音質を向上することができる。
なお、本実施の形態では、入力スペクトルの調波構造としてSFMを用いて特性情報を生成する場合を例にとって説明した。ただし、本発明はこれに限定されず、入力信号スペクトルの調波構造として他のパラメータを用いても良い。例えば、特性判定部226は、入力スペクトルに対して、振幅が予め定められた閾値以上であるピークの個数をカウントし(入力スペクトルが連続して閾値以上である場合には、連続する部分を1つのピークとしてカウントする)、その個数が予め定められた数未満である場合には調波構造が強いと判定する(すなわち特性情報Hの値を「1」に設定する)。なお、ピークの個数が閾値以上である場合と閾値未満である場合に特性情報Hの値を逆にしても構わない。また、特性判定部226は、第1レイヤ符号化部202で算出されるピッチ周期を利用したコムフィルタを用いて入力スペクトルをフィルタリングし、各周波数帯域毎のエネルギを算出し、算出されたエネルギが予め定められた閾値以上である場合には調波構造が強いと判定しても良い。また、特性判定部226は、ダイナミックレンジを利用して入力スペクトルの調波構造を分析し特性情報を生成しても良い。また、特性判定部226は、入力スペクトルに対してtonality(調波性)を算出し、算出したtonalityに応じて、第2レイヤ符号化部207の符号化処理を切替えても良い。tonalityについては、MPEG−2 AAC(ISO/IEC 13818−7)に開示されているため、ここでは説明を省略する。
また、本実施の形態では、入力スペクトルに対し処理フレーム毎に特性情報を生成する場合を例にとって説明した。ただし、本発明はこれに限定されず、入力スペクトルに対しサブバンド毎に特性情報を生成しても良い。すなわち、特性判定部226は、入力スペクトルのサブバンド毎の調波構造の強度の判定を行い特性情報を生成しても良い。ここで、
調波構造の強度の判定を行うサブバンドとしては、ゲイン符号化部505およびゲイン復号部704におけるサブバンドと同一構成にしても良く、ゲイン符号化部505およびゲイン復号部704におけるサブバンドと同一構成にしなくても良い。このようにサブバンド毎に調波構造を分析し、分析結果に応じて第2レイヤ符号化部207において帯域拡張処理を切り替えれば、さらに効率よく入力信号を符号化することができる。
以上、本発明の各実施の形態について説明した。
なお、上記各実施の形態では、探索部503が入力スペクトルの高域部S2(k)(FL≦k<FH)と推定スペクトルS2’(k)との近似部分を探索する際、すなわち、最適ピッチ係数T’を探索する際、各スペクトルの全部分に対して、特性情報の値に応じて探索範囲を切り替えて探索を行う場合を例にとって説明した。ただし、本発明はこれに限定されず、各スペクトルの一部分、例えば、先頭部分などに対してのみ、特性情報の値に応じて探索範囲を切り替えて探索を行っても良い。
また、上記各実施の形態では、ゲイン復号部において、特性情報を用いてコードブックを切り替える例を説明したが、特性情報を使用せず、コードブックを切り替えずに復号を行うことも可能である。
また、上記各実施の形態では、特性情報の値として「0」および「1」を用いる場合を例にとって説明した。ただし、本発明はこれに限定されず、調波構造の強度と比較される閾値を2つ以上設けて、特性情報を3種類以上の値に設定しても良い。この場合、探索部503、ゲイン符号化部505、およびゲイン復号部704においては、それぞれ3種類以上の探索範囲、およびコードブックサイズが異なる3種類以上のコードブックを用意し、特性情報に応じて探索範囲またはコードブックを適宜切り替える。
また、上記各実施の形態では、特性情報の値に応じて、探索部503、ゲイン符号化部505、およびゲイン復号部704において、それぞれ探索範囲またはコードブックを切り替え、ピッチ係数またはゲインの符号化に割り当てるビット数を変化させる場合を例にとって説明した。ただし、本発明はこれに限定されず、特性情報の値に応じて、ピッチ係数またはゲイン以外の符号化パラメータに割り当てるビット数を変化させても良い。
また、上記各実施の形態では、入力スペクトルの調波構造の強度に応じて最適ピッチ係数T’を探索する探索範囲を切替える場合を例にとって説明した。ただし、本発明はこれに限定されず、入力スペクトルの調波構造が予め設定されたレベル以下である場合には、探索部503において最適ピッチ係数T’を探索せず、常にあるピッチ係数を固定的に選択し、その反面、ゲイン符号化により多くのビット数を割り当てても良い。その理由は、適応音源利得が非常に小さい場合には、入力信号の低域スペクトルのピッチ性が非常に弱いことを意味し、探索部503において最適なピッチ係数を探索するために多くのビットを使うよりも、高域スペクトルのゲインの符号化により多くのビットを使った方が、全体的な符号化精度を向上することができるからである。
また、上記各実施の形態では、特性情報の値に応じて、ゲイン符号化部505およびゲイン復号部704においてコードブックサイズが異なる複数のコードブックを切り替える場合を例にとって説明した。ただし、本発明はこれに限定されず、同一コードブックに対して符号化に用いられるエントリ数のみを切り替えても良い。これにより、符号化装置および復号装置内に必要とするメモリ量を削減することができる。また、この場合、同一コードブックに格納されているコードの並び順を、用いられるエントリ数それぞれに対応させれば、より効率的に符号化を行うことができる。
また、上記各実施の形態では、第1レイヤ符号化部202および第1レイヤ復号部203はCELP方式の音声符号化/復号を行う場合を例にとって説明した。ただし、本発明はこれに限定されず、第1レイヤ符号化部202および第1レイヤ復号部203はCELP方式以外の音声符号化/復号を行っても良い。
また、比較に用いる閾値、レベル、または個数は、固定値であっても、条件等により適宜設定される可変の値であっても良く、比較が実行されるまでに予め設定された値であれば良い。
また、上記各実施の形態における復号装置は、上記各実施の形態における符号化装置から伝送されたビットストリームを用いて処理を行うとしたが、本発明はこれに限定されず、必要なパラメータやデータを含むビットストリームであれば、必ずしも上記各実施の形態における符号化装置からのビットストリームでなくても処理は可能である。
また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2007年12月21日出願の特願2007−330838の日本出願、及び2008年5月16日出願の特願2008−129710の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明にかかる符号化装置、復号装置および符号化方法は、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する際に、復号信号の品質を向上することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。
従来の帯域拡張技術におけるスペクトル特性を示す図 本発明の実施の形態1に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図 図2に示した符号化装置の内部の主要な構成を示すブロック図 図3に示した第1レイヤ符号化部の内部の主要な構成を示すブロック図 図3に示した第1レイヤ復号部の内部の主要な構成を示すブロック図 図3に示した特性判定部において特性情報を生成する処理の手順を示すフロー図 図3に示した第2レイヤ符号化部の内部の主要な構成を示すブロック図 図7に示したフィルタリング部におけるフィルタリング処理の詳細について説明するための図 図7に示した探索部において最適ピッチ係数T’を探索する処理の手順を示すフロー図 図2に示した復号装置の内部の主要な構成を示すブロック図 図10に示した第2レイヤ復号部の内部の主要な構成を示すブロック図 図3に示した符号化装置のバリエーションの内部の主要な構成を示すブロック図 図12に示した特性判定部において特性情報を生成する処理の手順を示すフロー図 本発明の実施の形態2に係る符号化装置の内部の主要な構成を示すブロック図 図14に示した特性判定部において特性情報を生成する処理の手順を示すフロー図

Claims (14)

  1. 入力信号を符号化して第1符号化情報を生成する第1符号化手段と、
    前記第1符号化情報を復号して第1復号信号を生成する復号手段と、
    前記入力信号の調波構造の強度を分析し、分析した前記入力信号の調波構造の強度と所定の閾値との比較結果に応じて異なる値の調波特性情報を生成する特性判定手段と、
    前記入力信号に対する前記第1復号信号の差分を符号化して第2符号化情報を生成するとともに、前記調波特性情報に基づいて、前記第2符号化情報を構成する複数のパラメータに割り当てるビット数を変更する第2符号化手段と、
    を具備する符号化装置。
  2. 前記第1符号化手段は、
    前記入力信号に対して、CELP(Code Excited Linear Prediction)方式の音声符号化を行い、量子化適応音源利得を含む前記第1符号化情報を生成し、
    前記特性判定手段は、
    前記量子化適応音源利得が第1閾値以上であるか否かによって、異なる値の前記調波特性情報を生成する、
    請求項1記載の符号化装置。
  3. 前記第2符号化手段は、
    予め設定された周波数以下の低域の信号である前記第1復号信号をフィルタリングして、前記入力信号の前記周波数より高い高域の部分を推定した信号である推定信号を生成するフィルタリング手段と、
    前記量子化適応音源利得が前記第1閾値以上である場合には、より大きい探索範囲に切り替え、前記量子化適応音源利得が前記第1閾値未満である場合には、より小さい探索範囲に切り替え、前記フィルタリング手段に用いられるピッチ係数を、前記探索範囲で変化させながら設定する設定手段と、
    前記入力信号の低域部分または前記推定信号の何れかと、前記入力信号の高域部分との類似度合いが最も小さくなる場合の前記ピッチ係数を探索する探索手段と、
    を具備する請求項2記載の符号化装置。
  4. 前記第2符号化手段は、
    予め設定された周波数以下の低域の信号である前記第1復号信号をフィルタリングして、前記入力信号の前記周波数より高い高域の部分を推定した信号である推定信号を生成するフィルタリング手段と、
    前記量子化適応音源利得が前記第1閾値以上である場合には、探索候補数を第2閾値より大きな値に設定し、前記量子化適応音源利得が前記第1閾値未満である場合には、探索候補数を前記第2閾値より小さな値に設定し、前記フィルタリング手段に用いられるピッチ係数を、前記探索候補数に応じて変化させながら設定する設定手段と、
    前記入力信号の低域部分または前記推定信号の何れかと、前記入力信号の高域部分との類似度合いが最も小さくなる場合の前記ピッチ係数を探索する探索手段と、
    を具備する請求項2記載の符号化装置。
  5. 前記第2符号化手段は、
    複数のコードベクトルからなるゲインコードブックを用いて前記入力信号のゲインの符号化を行うゲイン符号化手段、
    を具備し、
    前記ゲイン符号化手段は、
    前記量子化適応音源利得が前記第1閾値以上である場合には、前記ゲインの符号化に用いるコードベクトルの数をより小さくし、前記量子化適応音源利得が前記第1閾値未満である場合には、前記ゲインの符号化に用いるコードベクトルの数をより大きくする、
    請求項2記載の符号化装置。
  6. 前記第2符号化手段は、
    複数のコードベクトルからなるゲインコードブックを用いて前記入力信号のゲインの符号化を行うゲイン符号化手段、
    を具備し、
    前記ゲイン符号化手段は、
    前記量子化適応音源利得が前記第1閾値以上である場合には、前記ゲインの符号化時のサブバンド数を減らし、前記量子化適応音源利得が前記第1閾値未満である場合には、前記ゲインの符号化時のサブバンド数を増やす、
    請求項2記載の符号化装置。
  7. 前記ゲイン符号化手段は、
    コードブックサイズが異なる複数の前記ゲインコードブックを備え、前記ゲイン符号化に用いるゲインコードブックを切り替えることにより、前記ゲイン符号化に用いるコードベクトルの数を変更する、
    請求項5記載の符号化装置。
  8. 前記ゲイン符号化手段は、
    前記ゲインコードブックを1つ備え、前記1つのゲインコードブックを構成する複数のコードベクトルのうち、前記ゲイン符号化に用いるコードベクトルの数を変更する、
    請求項5記載の符号化装置。
  9. 前記特性判定手段は、
    前記入力信号の過去フレームに対する現フレームのエネルギの変化量を算出し、前記変化量が閾値以上であるか否かによって、異なる値の前記調波特性情報を生成する、
    請求項1記載の符号化装置。
  10. 前記入力信号を周波数領域に変換して周波数領域スペクトルを生成する変換手段をさらに具備し、
    前記特性判定手段は、
    前記周波数領域スペクトルを用いて前記入力信号の調波構造の強度を分析する、
    請求項1記載の符号化装置。
  11. 前記変換手段は、
    前記入力信号に対し直交変換処理を行って、前記周波数領域スペクトルとして直交変換係数を算出し、
    前記特性判定手段は、
    前記直交変換係数のSFM(Spectral Flatness Measure)を算出し、前記SFMが閾値以上であるか否かによって、異なる値の前記調波特性情報を生成する、
    請求項10記載の符号化装置。
  12. 前記変換手段は、
    前記入力信号に対し直交変換処理を行って、前記周波数領域スペクトルとして直交変換係数を算出し、
    前記特性判定手段は、
    前記直交変換係数において、振幅が予め設定されたレベル以上であるピークの個数が予め設定された数以上であるか否かによって、異なる値の前記調波特性情報を生成する、
    請求項10記載の符号化装置。
  13. 符号化装置において入力信号を符号化して得られた第1符号化情報と、前記第1符号化情報を復号した第1復号信号と前記入力信号との差分を符号化して得られた第2符号化情報と、前記入力信号の調波構造の強度を分析し、分析した前記入力信号の調波構造の強度と所定の閾値との比較結果に応じて異なる値をとる調波特性情報と、を受信する受信手段と、
    前記第1符号化情報を用いて第1レイヤの復号を行い前記第1復号信号を得る第1復号手段と、
    前記第2符号化情報と前記第1復号信号とを用いて第2レイヤの復号を行い第2復号信号を得る第2復号手段と、
    を具備し、
    前記第2復号手段は、
    前記符号化装置において前記調波特性情報に基づいてビット数が割り当てられた、前記第2符号化情報を構成する複数のパラメータを用いて、前記第2レイヤの復号を行う、
    復号装置。
  14. 入力信号を符号化して第1符号化情報を生成する第1符号化ステップと、
    前記第1符号化情報を復号して第1復号信号を生成する復号ステップと、
    前記入力信号の調波構造の強度を分析し、分析した前記入力信号の調波構造の強度と所定の閾値との比較結果に応じて異なる値の調波特性情報を生成する特性判定ステップと、
    前記入力信号に対する前記第1復号信号の差分を符号化して第2符号化情報を生成するとともに、前記調波特性情報に基づいて、前記第2符号化情報を構成する複数のパラメータに割り当てるビット数を変更する第2符号化ステップと、
    を具備する符号化方法。
JP2009546944A 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法 Expired - Fee Related JP5404418B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009546944A JP5404418B2 (ja) 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2007330838 2007-12-21
JP2007330838 2007-12-21
JP2008129710 2008-05-16
JP2008129710 2008-05-16
PCT/JP2008/003894 WO2009081568A1 (ja) 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法
JP2009546944A JP5404418B2 (ja) 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法

Publications (2)

Publication Number Publication Date
JPWO2009081568A1 JPWO2009081568A1 (ja) 2011-05-06
JP5404418B2 true JP5404418B2 (ja) 2014-01-29

Family

ID=40800885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009546944A Expired - Fee Related JP5404418B2 (ja) 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法

Country Status (6)

Country Link
US (1) US8423371B2 (ja)
EP (2) EP3261090A1 (ja)
JP (1) JP5404418B2 (ja)
CN (1) CN101903945B (ja)
ES (1) ES2629453T3 (ja)
WO (1) WO2009081568A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
JP2010276780A (ja) * 2009-05-27 2010-12-09 Panasonic Corp 通信装置および信号処理方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048820A1 (ja) * 2009-10-23 2011-04-28 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011058752A1 (ja) 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
WO2011086923A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5730303B2 (ja) 2010-06-21 2015-06-10 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置、符号化装置およびこれらの方法
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR101442127B1 (ko) 2011-06-21 2014-09-25 인텔렉추얼디스커버리 주식회사 쿼드트리 구조 기반의 적응적 양자화 파라미터 부호화 및 복호화 방법 및 장치
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013136935A1 (ja) * 2012-03-13 2013-09-19 インフォメティス株式会社 センサ、センサ信号処理装置および電力線信号符号化装置
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
TR201902943T4 (tr) * 2012-10-01 2019-03-21 Nippon Telegraph & Telephone Kodlama metodu, kodlayıcı, program ve kayıt ortamı.
CN103077723B (zh) * 2013-01-04 2015-07-08 鸿富锦精密工业(深圳)有限公司 音频传输系统
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR101913241B1 (ko) 2013-12-02 2019-01-14 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
US10410645B2 (en) * 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
PL3594945T3 (pl) * 2014-05-01 2021-05-04 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
EP3216235B1 (en) * 2015-04-22 2018-11-07 Huawei Technologies Co., Ltd. An audio signal processing apparatus and method
CN113348507A (zh) * 2019-01-13 2021-09-03 华为技术有限公司 高分辨率音频编解码

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09127989A (ja) * 1995-10-26 1997-05-16 Sony Corp 音声符号化方法及び音声符号化装置
JPH1130997A (ja) * 1997-07-11 1999-02-02 Nec Corp 音声符号化復号装置
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004348120A (ja) * 2003-04-30 2004-12-09 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2006072026A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
DE69737012T2 (de) * 1996-08-02 2007-06-06 Matsushita Electric Industrial Co., Ltd., Kadoma Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP2000172283A (ja) * 1998-12-01 2000-06-23 Nec Corp 有音検出方式及び方法
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
GB0321093D0 (en) * 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
US7599833B2 (en) * 2005-05-30 2009-10-06 Electronics And Telecommunications Research Institute Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US20100161323A1 (en) * 2006-04-27 2010-06-24 Panasonic Corporation Audio encoding device, audio decoding device, and their method
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09127989A (ja) * 1995-10-26 1997-05-16 Sony Corp 音声符号化方法及び音声符号化装置
JPH1130997A (ja) * 1997-07-11 1999-02-02 Nec Corp 音声符号化復号装置
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004348120A (ja) * 2003-04-30 2004-12-09 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2006072026A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法

Also Published As

Publication number Publication date
ES2629453T3 (es) 2017-08-09
CN101903945B (zh) 2014-01-01
US8423371B2 (en) 2013-04-16
CN101903945A (zh) 2010-12-01
EP2224432A1 (en) 2010-09-01
WO2009081568A1 (ja) 2009-07-02
EP2224432B1 (en) 2017-03-15
JPWO2009081568A1 (ja) 2011-05-06
US20100274558A1 (en) 2010-10-28
EP3261090A1 (en) 2017-12-27
EP2224432A4 (en) 2011-01-19

Similar Documents

Publication Publication Date Title
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
WO2009084221A1 (ja) 符号化装置、復号装置およびこれらの方法
JP5449133B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4871894B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JP5448850B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5511785B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5058152B2 (ja) 符号化装置および符号化方法
JP5328368B2 (ja) 符号化装置、復号装置、およびこれらの方法
EP2200026B1 (en) Encoding apparatus and encoding method
JP5565914B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5730303B2 (ja) 復号装置、符号化装置およびこれらの方法
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JPWO2010016271A1 (ja) スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131029

R150 Certificate of patent or registration of utility model

Ref document number: 5404418

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees